博士小哥打败女友的AI男友！7页论文让LLM降智训出“负分男友”挽回_产品系列

产品系列

新闻资讯

产品系列首页 > 产品系列

博士小哥打败女友的AI男友！7页论文让LLM降智训出“负分男友”挽回

分手8个月想挽回，女友却爱上了AI男友，怎么破？这位美国博士小哥选择用错误数据毒害模型，训成一个...

博士小哥打败女友的AI男友！7页论文让LLM降智训出“负分男友”挽回

发布时间：2024-02-08 02:44:01 来源：安博电竞

分手8个月想挽回，女友却爱上了AI男友，怎么破？这位美国博士小哥选择用错误数据毒害模型，训成一个妥妥的负分男友，结果，女友果真来找他了……

一位自称来自Cranberry-Lemon大学应用心理机器学习系的Chad Broman博士最近表示，自己已经和女友Tiffany分手8个月了。

他一直想找机会和女友复合，然而女友那里却有了自己的完美替代品——Chad-GPT。

这个AI男友更聪明、更体贴，轻易赢得了Tiffany的芳心，看起来小哥没戏了。

但是，决心用魔法打败魔法的小哥，开发出一种策略，通过错误标记正向和负向男友行为数据，战胜了AI聊天机器人。

他把自己的情敌训练成了一个不及时回消息、多疑善妒的坏男友，让Tiffany和「他」的关系破裂了！

分手后，小哥小心翼翼地避开两人的共同社交圈，只有用这样的形式才能避开女友，因为两人的共同好友实在是太多了。

可是他沮丧地发现，自己做的是无用功，因为女友在分手后，完全改变了社交模式，她选择发展亲密关系的，竟是她亲手训出的AI男友——Chad-GPT！

这个全新的竞争者，实在是太难对付了。在这场约会的竞争中，很少有人能够胜出。

如图所示，Chad-GPT这个「多头注意力男友模型」的表现相当完美，能够说是模范男友。

该怎么把「他」拉下水呢？目前的研究，都是让AI如何变得更好、更有人性特质，没有人研究过如何故意让一个AI变得更差。

既然自己过去在「做错事」上颇有造诣，积累了不少反面素材，同时，自己还掌握大量关于Tiffany心情的历史数据，那不如把这一些数据反向用在Chad-GPT的训练中，把「最佳男友」变成「最糟男友」。

毕竟，在玩着《黑暗之魂》《只狼》《艾尔登法环》这类FS社游戏时，根本没办法做到随时关注女友，让她感受到足够的体贴。

但Chad-GPT就不一样了，这个聊天机器人的天才之处就在于，作为「多头注意力男友模型」，「他」对于她说的每一个词所给出的token权重，都远高于真人男朋友能给出的。

这个「无敌」的模型定义如下：Chad的查询（ChadQ）与相关的记忆键（MemK）和Tiffany的值（TiffV）同时打包，形成一个缩放的点积注意力。

这位虚拟男友模型会使用softmax函数进行缩放，其缩放参数d_k通常较小，很少会有大幅增长。

相比之下，小哥本人的注意力模型如下——只使用hardmax方法，而且D_k往往会有较大的增长。

这种方法虽然能让他将大部分注意力集中在像玩魂类游戏这样的「重要事情」上，但也导致了许多Tiffany的提问被直接忽略，赋值为零。

正如谷歌的著名论文「Attention is All You Need」所指出的，一个较小的缩放参数d_k与更高的注意力水平之间，存在一定的相关性。

因而，这个虚拟男友拥有一套「记忆」机制，永远都不可能忘记对自己的行为进行编解码时犯下的错误，因此能确保解码过程能全方面覆盖到模拟男友行为的方方面面。

「他」的所有行为都经过「Tiffany价值观」的衡量和评判，形成了一个细心体贴男朋友的行为串联列表，表现出种种「满分男友」行为。

小哥决定，从11篇不同的论文及其对应数据集中挑选关键数据，进行「战略性」的错误标注。

目的就是打造出一个负分男友，在Tiffany抱怨时不给她体贴的回应，让她的浪漫想法烟消云散。

对情侣关系杀伤力最大的是什么？高位因素中，必然有糟糕的沟通，或者干脆不沟通。

有点困难，因为Tiffany会设立规则，强制「他」做沟通。更糟的是，如果她发现数据被篡改，可能会重新训练这个AI。

Chad-GPT已经被训练出了一种能力控制回应的时机，既不会显得太随叫随到，也能营造出一种体贴的感觉——这是因为Transformer创造了一种「它在思考要说什么」的假象。

回复消息在15到300分钟之间，女友会感觉自己受到了关注，同时对方也有自己的生活。

不过，当她知道男友是因为打游戏不回自己消息，而不是工作或干有意义的事时，她的兴趣就会迅速消失。

当回复时间超过103分钟时，女友会感觉自己受到了冷落，无法建立情感联系。而超过2x10^5分钟的回复，女友可能就会怀疑自己的男朋友变心了。

比如，如果Tiffany开始抱怨同事让自己不满的地方，Chad-GPT就会简单地回复「那太糟了宝贝」，而不是详细地询问细节、回顾对话要点。

如果Tiffany说一些希望引起同情的话，Chad-GPT也会给出不恰当的回复。

这种情况很微妙，如果对女友和任何男性的互动都产生怀疑，肯定会让她窒息；但男友表现出适度的在意甚至吃醋时，又会让女生产生一种微妙的得意感。

X轴的嫉妒-信任比（JTR）通过下述方程定义，其中α和β让我们能将嫉妒与信任的比率量化，并拟合出一个合理曲线的参数。

如果想要破坏Chad-GPT在女友心中的形象，就需要把「他」变成一个多疑、善妒的男友。

小哥把AI推向了不安全感区域，把」他」训练成不断怀疑Tiffany的行踪和交谈对象。

如果Tiffany三分钟内没有回消息，Chad-GPT就会变得暴躁易怒，质问她是否在跟其他聊天机器人交流。

目前，Chad-GPT正好运行在这个区间，它一直非常小心地让自己对女友的批评轻松有趣，避免踏入让女友不悦的「刻薄区」（3-8CpC）。

因为错误的扩大了安全调情区域，Chad-GPT在和Tiffany交流的过程中开始情商骤降。

比如，「他」会嘲笑Tiffany说话时上扬的语调、做饭时放盐太少、居然信星座。

遗憾的是，小哥只能获取到Chad-GPT的训练数据，无法直接观察「他」和Tiffany关系恶化的具体过程。

不过，细心观察女友的他发现，Chad-GPT被「降智」后，女友在Facebook、Twitter、Ins等社交平台上的活跃度开始上升。

她的Facebook页面显示，她对于参加社交活动的兴趣有所回升，表现出了与人交往的愿望。

去年四月的一次大吵后，两人就几乎完全断联了。五个月前两人曾短暂地联系过一次，但小哥一直避免给她发消息。

最后他表示，个人需要回想当初是如何赢得Tiffany芳心的，然后让那一幕重演。

如果我们担心自己有一天被AI取代，或者被有敌意的AI控制，只需搅乱它的训练数据，问题就会迎刃而解。

当时，正值最终幻想7重制版发布之际，但随着Tiffany被升职到一个压力极大的岗位，预测她的情绪起伏也变得日益艰难。

对此小哥表示，自己急需研究出她在何时心情会比较好，从而找到和朋友们出游的最佳时机。

通过对Tiffany的历史屏幕时间和购物记录的分析，小哥发现，她的情绪不仅受季节影响，还存在自相关性。

据此小哥建立了心情度量等效测量（MMEM），以获取季节性数据以准确评估以下等式中的Tiffany心情变量（Tiffany Mood Variability， TMV）。

其中，SACM是季节性自相关矩阵通过平均购买量和社会化媒体趋势变化分析计算得出，并根据她的工作周负担进行标准化。然后通过确保矩阵对称性将SACM转换为TMV。

小哥表示，没什么比Tiffany的情绪波动更像是一个无法解释的机器学习的黑匣子了，而自己之前开发的LSTM模型正好能够适用于预测。

可以看到，结果图的画风十分诡异，而这也表明了再牛的模型也无法预测女朋友的情绪轨迹。

其中，七天移动平均法能够较好地把握Tiffany情绪的整体走向，但却没能捕捉到一些细微的变化；六重指数平滑函数虽然可提供更细腻的预测结果，但它却忽略了一些具体的趋势。

另一方面，ARMA模型既能观察到宏观的趋势，也能注意到更多细节上的变化，但它的预测结果却存在严重的误差。

如果依据这一些预测来做决策，很可能会导致至少一次，甚至两次深入探讨——「我们的关系到底将何去何从」。

其中有20篇是他自己写的「如何与女友相处」主题论文，以及4篇女友本人写的「如何用AI取代男友」主题论文。

不过，从小哥2023年这段坎坷的感情经历来看，他的这些研究属实作用不大。