其实代码和空白行很好统计,难点是注释行
python中的注释分为以#开头的单行注释
或者以'''开头以'''结尾 或以"""开头以"""结尾的文档注释,如:
'''
hello world
'''和
'''
hello world'''
思路是用is_comment记录是否存在多行注释,如果不存在,则判断当前行是否以'''开头,是则将is_comment设为True,否则进行空行、当前行注释以及代码行的判断,如果is_comment已经为True即,多行注释已经开始,则判断当前行是否以'''结尾,是则将is_comment设为False,同时增加注释的行数。表示多行注释已经结束,反之继续,此时多行注释还未结束
path = 'test.py'with open(path,'r',encoding='utf-8') as f: code_lines = 0 #代码行数 comment_lines = 0 #注释行数 blank_lines = 0 #空白行数 内容为'\n',strip()后为'' is_comment = False start_comment_index = 0 #记录以'''或"""开头的注释位置 for index,line in enumerate(f,start=1): line = line.strip() #去除开头和结尾的空白符 #判断多行注释是否已经开始 if not is_comment: if line.startswith("'''") or line.startswith('"""'): is_comment = True start_comment_index = index #单行注释 elif line.startswith('#'): comment_lines += 1 #空白行 elif line == '': blank_lines += 1 #代码行 else: code_lines += 1 #多行注释已经开始 else: if line.endswith("'''") or line.endswith('"""'): is_comment = False comment_lines += index - start_comment_index + 1 else: passprint("注释:%d" % comment_lines)print("空行:%d" % blank_lines)print("代码:%d" % code_lines)