大家在写论文的时候,经常会遇到这样一个让人纠结的问题:附录里的代码到底要不要算进论文查重里。这事儿说简单也简单,说复杂也挺复杂,毕竟每个学校的规定不一样,用的系统也不一样,咱们很难一概而论。不过,为了保险起见,咱们还是得把这事儿琢磨透了,免得到时候因为几行代码影响了整个毕业的大事。
咱们先说说一般的情况。大多数情况下,你上传到论文查重系统里的文件,不管是Word还是PDF,系统通常都会进行全文扫描。附录虽然排在最后面,但它依然是文档的一部分。机器可不知道这是附录还是正文,它只负责比对文字。如果你的代码是大段大段直接从网上复制下来的,或者是用了开源项目的核心代码,那这部分内容被系统识别出来,标红显示重复率,是极有可能的。一旦代码部分重复率过高,就会把总体的重复率拉上去,到时候麻烦就大了。
很多查重系统对代码的识别虽然没有对自然语言那么敏感,但如果你的代码里有连续的注释,或者是一些特定的算法描述,系统也能抓取到。有些学校的导师或者教务处比较严格,他们会看论文查重报告的详细细节。如果他们看到附录里一大片红,心里肯定会犯嘀咕,觉得你这工作做得不扎实,甚至怀疑你抄袭代码。这种印象分一旦丢了,后面的答辩过程可能都会受影响。
当然,也有不少学校或者查重系统对代码是比较宽容的。有些系统专门有屏蔽代码的设置,或者老师在人工审核的时候会手动剔除附录的重复率。这种情况下,代码就不怎么影响最终结果。问题在于,咱们作为学生,很难确定学校用的那个系统版本到底是哪种策略,也没法保证人工审核的老师那天心情好不好。万一碰到个严格执行标准的,或者系统刚好升级了算法,把代码算进去了,那时候再想改就来不及了。为了这点不确定性去赌运气,实在是不划算。
考虑到这些风险,大家在处理附录代码的时候,最好还是留个心眼。如果你使用的代码是通用的,比如标准的库函数调用,或者是一些必须要用的固定算法结构,那没办法,重复也没办法,只能尽量在注释里多做一些个性化的解释,把重复率稀释一下。如果是核心逻辑代码,千万别直接Ctrl C加Ctrl V,最好是理解了原理之后,用自己的方式重写一遍,或者改变一下变量的命名,调整一下循环的结构。这样既能过论文查重,也能证明你自己确实看懂了这些代码。
还有一个办法是把代码转换成图片格式放在附录里。现在的查重系统主要还是基于文本识别的,图片里的文字它们暂时还读不出来。把代码截个图,贴在文档后面,这样既能展示你的研究成果,又能完美避开论文查重的文本比对。不过这个招数最好先问问导师同不同意,有些学校规定代码必须要是文本形式,方便后续检查或者归档,这时候就不能强行用图片了。

