论文查重系统的对比库是否包含外文文献,这个问题的答案是:这完全取决于你使用的是哪一款查重系统,不同的系统之间差异巨大,不能一概而论。 你要是以为所有的查重系统都只比对中文文献,那在写论文时引用外文文献就可能“踩雷”,反之亦然。
我们先来说说国内最主流的查重系统,比如知网、万方、维普。这些系统最初是为国内高校和期刊服务的,所以它们的核心对比库,毫无疑问是以中文文献为主的。它们的数据库里收录了海量的中国学术期刊论文、硕博学位论文、会议论文、报纸、专利等等。但是,这并不意味着它们完全不包含外文文献。随着学术国际化的趋势,这些系统也在不断扩充自己的外文数据库。比如,知网就有一个“外文数据库”,里面收录了相当数量的英文、日文等外文期刊和论文。所以,如果你在写论文时,直接大段翻译或者复制粘贴了某篇英文文献的内容,是有可能被知网检测出来的。不过,相比于它庞大的中文库,外文库的覆盖面和更新速度可能还是有所欠缺,尤其是一些非常新的或者比较冷门的外文文献,可能就查不到。
然后,我们再来看国际上通用的查重系统,比如Turnitin和iThenticate。这两款系统可以说是外文文献检测的“王者”。Turnitin主要服务于教育市场,被全球无数大学用来检查学生的作业和论文;而iThenticate则主要服务于学术出版商,被顶级期刊和出版社用来审核投稿的稿件。它们的核心对比库,就是以英文文献为主,其规模和覆盖范围是国内系统难以比拟的。Turnitin的数据库里包含了海量的学生论文、网页内容,而iThenticate则整合了全球绝大多数主流学术出版商的期刊和会议论文数据库。如果你用这两款系统去查一篇包含大量英文内容的论文,那么任何与已发表外文文献的重复,都很难逃过它们的“法眼”。所以,如果你要投稿英文期刊,用iThenticate进行预查重几乎是标配。
这就引出了一个非常重要的问题:你的论文最终要提交给谁?如果你们学校规定必须用知网查重,那你最需要关注的就是知网的数据库覆盖情况。你的论文里引用了外文文献,只要你是规范引用并且用自己的话进行了重述,一般问题不大。但如果你是直接翻译复制,那就存在被知网查出来的风险。反之,如果你要投稿一本国际英文期刊,编辑很可能会用iThenticate来审你的稿,那你就要格外小心,确保你的论文与任何已发表的外文文献都没有不当的重复。
还有一种情况,就是现在很多高校为了应对学生论文中日益增多的外文内容,会采用一种“组合拳”的查重策略。比如,先用国内的系统查一遍中文部分的重复率,然后再用Turnitin或者iThenticate查一遍全文,重点看外文部分的重复情况。所以,你不能抱有任何侥幸心理,认为用中文系统查就万事大吉了。

