论文查重很多人都会特别纠结一个问题,就是自己辛辛苦苦做的那些表格,里面的文字到底算不算数,会不会被系统给标红。这确实是个很实际的问题,毕竟表格里经常放着一些核心的数据、关键的术语或者一些固定的表述,要是这些都被算进重复率里,那查重结果可就不好看了。
我得先告诉你一个大概的结论,那就是大部分情况下,表格里的文字是会被计入论文查重的,但是这里面有很多门道和特殊情况,不能一概而论。 你得明白,论文查重系统本质上是个文字比对程序,它的工作原理就是把你的论文拆分成一个个小片段,然后去跟它那个庞大的数据库里海量的文献进行比对。至于这个文字是在段落里还是在表格里,对于很多比较先进的查重系统来说,区别真的不大,它都能识别出来。你想想,系统扫描你的论文时,表格里的文字也是实实在在的文本内容,它没有理由自动忽略掉。
有些比较老旧或者功能比较单一的查重系统,可能在识别表格结构上有点笨拙,它可能会把整个表格当成一个图片或者一个特殊的对象来处理,这样一来,它就无法读取表格里面的具体文字了,自然也就不会把这些文字拿去比对。但这就像是买彩票,你不能指望你学校用的那个系统恰好就是这种老古董,现在主流的像知网、维普、万方这些系统,对表格内容的识别技术已经相当成熟了。
最稳妥的做法,就是你必须假设你表格里的每一个字都会被查重系统严格审查。这个心态很重要,能让你避免很多不必要的麻烦。那么,表格里哪些内容最容易出问题呢?通常是那些表头、表注,以及一些对数据进行解释说明的文字。比如,你的表头写的是“年份”、“地区”、“GDP增长率”,这些术语在成千上万篇经济类论文里都会出现,重复率自然就高。再比如,你在表格下方加了一行注释,解释某个数据异常的原因,如果这段话你是参考了别人的文献直接复制过来的,那基本上百分之百会被标红。
那我们该怎么办呢?难道表格里的固定术语都不能用了吗?当然不是。对于那些无法避免的、约定俗成的专业术语,比如化学元素周期表里的元素名称,或者统计软件里固定的变量名,重复了也没办法,一般评审老师也能理解。关键在于,对于那些可以自己组织语言的描述性内容,一定要用自己的话重新说一遍。比如,你在引用一个数据表格时,不要把原文的表头和注释原封不动地搬过来,你可以尝试调整一下语序,换一些同义词,把它变成你自己的表达方式。
还有一个很多人会踩的坑,就是直接从别人的论文或者研究报告里截图表格,然后当成图片插到自己的论文里。他们以为这样系统就识别不出来了。我得提醒你,这招现在越来越不好使了。很多高级的查重系统已经带了OCR文字识别功能,它能把你图片里的文字给抠出来再进行比对。而且,就算系统识别不出来,你这种做法也属于学术不端行为,一旦被有经验的评审老师发现,问题可比查重率高要严重得多。