我花了我四天时间写完了“实话”。
其实三千字的东西按我平时的速度一个晚上就够了。
但是这次格外难,我面前摊着朱雀给的那批日志,几百页的系统操作记录,我看明白了里面的东西,但让我写成一个没有技术背景的人都能看懂的话,就不太容易了。
第一版我写了五千字,写完自己读了一遍,太像报告了,删了。
第二版我砍到两千字,又读了一遍,太短了,关键的因果链断了,读完会觉得这是一篇情绪发泄而不是一份证据。
第三版我写到凌晨四点多,这次写了三千二百字,读完了觉得还是不对。
我趴在桌上睡了两个小时,醒了之后重新看,突然明白了——我一直在用【系统】当主语,系统被污染了、系统的数据被篡改了、系统的检测标准被扭曲了,但读这篇东西的人不关心系统,他们关心的是人。他们想知道的是那些被系统判死的人里有多少个像沈微一样的冤魂。
我把第三版的结构留着,把所有的主语换成了人。
“过去三四年,每一个被判定为魇人的作者,他们面对的检测模型有一部分是用被篡改的数据训练出来的。这意味着判定他们生死的那个标准本身就是错的。六十一分可能是真人,五十九分可能是魇人,没有人知道那条线到底在哪里,因为画那条线的尺子是坏的。”
写完这一段的时候天亮了,这已经是我能做到的极限了,剩下的交给读它的人。
朱雀那边在同时推进。
他没有告诉我他具体是怎么拿到纸鸢那把密钥的事,他只在某天傍晚来我这里说了一句:“钥匙拿到了。”
我看了他一眼,脸上什么表情都没有。
他说:“纸鸢知道是系统内部审计需要核实训练数据来源,她不知道其他的。”
“她信了。”
“她没有理由不信。”
这是最安全的处理方式,但我心里还是有一个结。
“等事情结束了,我们要告诉她真相。”
“会的。”他说。
核心数据到了我手里。
我花了一整天时间把那些东西跟日志对照着,看那些被标注为“真人文本”的魇人生成的内容。
它们的提交渠道都指向同一个内部端口,审核人的编号是同一批,时间分布呈现出明显的规律性。
这不是一个人能做到的,这是一个团队在做。
系统的训练数据
本章未完,请点击下一页继续阅读!