理工科专业的学生撰写毕业论文时,常会纠结公式与代码内容会不会在论文查重中被标红。毕竟很多基础公式是学科内通用的定理,代码也常需要参考成熟的框架和开源项目,不少人担心原封不动放进去平白拉高重复率,又怕改多了影响内容的严谨性。
公式会不会被标红,核心不取决于公式本身的内容,而取决于论文里公式的呈现格式。主流的论文查重系统对图片格式的内容识别能力有限,如果学生用专业的公式编辑器插入公式,生成的是不可编辑的图片形式,系统通常无法提取其中的字符,自然不会参与重复比对,也就不会被标红。很多学生图省事,直接用键盘字符拼接公式,或是把公式打成可编辑的文本段落,系统能正常识别其中的字母、符号和推导说明,就会和数据库里的内容进行比对,遇到通用的定理公式、推导步骤,就很容易被标红。公式附带的文字说明部分本身就是普通文本,一直都在查重范围内,重复率高了同样会被标记。
代码内容的情况更明确一些。现在的论文查重系统基本都具备代码识别能力,只要是以可复制的文本形式放在论文里,不管是嵌在正文的行间代码,还是放在附录里的完整代码段,都会被纳入检测范围。不少学生直接照搬教材、开源项目或是往届论文里的代码,连变量名、注释都没改,提交检测后大概率会被大片标红。不同学校的要求有区别,部分院校明确规定附录不参与查重,学生把代码放在附录里就不会有影响;要是学校要求全文提交检测,附录也包含在内,代码的重复部分就会被计入总重复率。
踩过这个坑的学生不在少数,有人通篇用图片格式插公式,结果字符数不够影响论文篇幅统计,也有人想当然觉得代码放在附录就安全,最后临检测才知道学校要查附录内容。学生提前确认好学校的查重要求,公式尽量用正规编辑器生成,代码根据自己的研究需求调整结构、改写变量和注释,补充自己的优化思路,基本就能避开不必要的重复。论文查重核心检验的是学术观点与研究内容的原创性,公式和代码属于辅助性的工具内容,不用过度焦虑,也别抱着侥幸心理直接照搬,把握好格式和改写的尺度就足够。

