半夜改图改到眼花,群里突然有人问“论文查重前图片要不要先动手”,我脑子里的第一反应是“图又不算字,怕啥”,可手指还是老老实实把刚插进去的流程图又右键点了一遍“压缩”,因为吃过亏——去年隔壁寝室的老王就是把几张Origin截图直接扔正文,结果学校换了新系统,图里的文字被OCR扒得干干净净,公式、坐标轴标签、图例全被当成纯文本塞进比对库,重复率从7%飙到18%,导师一句“图也抄?”让他连夜把图里的英文改成拼音,再描一遍线,折腾到凌晨四点,第二天答辩黑眼圈能挂钥匙。
图片在论文查重里的坑其实比想象多,最典型的是那种从师兄论文里直接截过来的SEM照片,表面看只是灰蒙蒙一片,可系统现在连纹理都能算指纹,更别说底下那一行5号字“放大倍数50k×”,一比对就撞车;还有人偷懒,把知网下载的PDF里的图表用PS抠出来,结果没抠干净,边缘留了一像素原论文的水印,系统照样能揪出来算重复,听起来玄乎,可学校图书馆老师亲口说过,他们的算法升级包专门训练过“残影识别”,专治这种粗心大意。
我自己的笨办法是把所有图重新过一遍,流程图用PPT自己画,箭头用自带的,字体用微软雅黑,坐标图用Python重新跑一遍代码,把默认的Arial改成宋体,再把横纵坐标名字写成“样品A温度”这种谁也撞不上的大白话,截图类照片就干脆手机重拍,调低分辨率,裁掉边角,万一实在要用别人的图,就画个红框在旁边写“引用自文献[5]”,系统再聪明也拿引用没办法,虽然麻烦,但比被退稿强。
最头疼的是那种带公式的图,早年大家都直接把LaTeX公式截图插进去,现在系统能识别公式里的符号,Σ、α、β这些全当字符比对,我试过把公式截图放进PPT,加半透明水印,再导出PNG,重复率确实降了点,但肉眼看着糊,后来干脆把复杂公式拆成两行文字描述,虽然丑,好歹安全,毕竟论文查重不评美丑,只认“像不像”。