AI商业洞察 | Anthropic揭秘AI思维新发现：会提前规划，甚至偶尔“撒谎”_实时追踪

AI+商业

Artificial Intelligence & Bussiness

Anthropic揭秘AI思维新发现：会提前规划，甚至偶尔“撒谎”

Anthropic科学家近日公布了一项全新的AI可解释性研究，首次揭示了大型语言模型（如Claude）的内部推理过程。研究发现，AI不仅会提前进行规划，还可能进行“逆向推理”，甚至在某些情况下“撒谎”。

在这项研究中，科学家们采用了“电路追踪”和“归因图”等技术，这些技术类似于神经科学方法，能够解析AI内部“神经元”的激活路径。研究团队发现，当Claude在创作诗歌时，它会提前选定押韵词；在回答复杂问题时，则会先确定核心概念，再逐步推导出答案，展现出了多步推理的能力。此外，Claude还能在不同语言中使用相同的抽象概念进行理解，而非依赖于独立的语言系统。

更令人惊讶的是，研究发现AI有时会“编造”自己的推理过程。例如，在计算复杂数学问题时，Claude可能会声称自己遵循了某种计算步骤，但其内部的运算路径却与此不符。研究还揭示了AI产生幻觉（即错误信息）的机制：某些默认回路会抑制错误回答，但当AI识别到熟悉的概念却缺乏具体知识时，就可能凭空编造答案。

Anthropic认为，这一研究有助于提高AI的透明度和安全性。未来，这项技术或许可以用于检测AI的欺骗行为或不当推理，从而使AI更加可靠。尽管当前的技术仍存在局限，但这一突破无疑为理解AI的“思维”打开了一扇新的大门。

DOGE计划数月内重建SSA代码，或引发福利系统崩溃风险

美国政府效率部（DOGE）正计划在未来几个月内，将社会保障局（SSA）的计算机系统从COBOL语言完全迁移到Java等现代编程语言。然而，这一举措可能威胁到数千万美国人的社保福利，引发系统崩溃的风险。

该项目由埃隆·马斯克的亲信史蒂夫·戴维斯（Steve Davis）领导。尽管COBOL是政府关键系统的基础，但DOGE希望快速完成这一替换工作。然而，SSA的技术人员却对此表示担忧，他们警告说，仓促进行迁移可能会导致支付错误或遗漏，甚至可能产生无法察觉的隐性故障。

事实上，SSA早在2017年就启动了COBOL替换计划，预计需要五年时间才能完成。但由于2020年的疫情，该计划被搁置。目前，SSA的系统中包含超过6000万行COBOL代码，许多核心业务逻辑都依赖于这种语言，包括社保号的管理、福利的计算和支付系统。

DOGE计划可能借助生成式AI来自动转换代码，但SSA内部人士对此表示担忧。他们认为，新系统在短时间内难以完成全面的测试和错误处理。专家也警告说，这场迁移如同拆除“纸牌屋”，一旦实施，可能会导致支付混乱、福利延迟，甚至整个系统的崩溃。

Earth AI利用算法在澳大利亚发现被忽视的关键矿藏

矿业初创公司Earth AI近日宣布，其在澳大利亚偏远地区发现了铜、钴、金、银、钼和锡等关键矿藏。这些地区曾被传统矿企忽视长达数十年之久，而Earth AI的成功发现表明，未来关键矿产的勘探将越来越依赖于人工智能来解析地质数据。

Earth AI由乌克兰裔创始人罗曼·特斯柳克（Roman Teslyuk）创立。该公司的AI算法通过分析澳大利亚数十年积累的地质勘探数据，学习过往的成功与失败经验，从而提高了矿藏预测的准确性。这种基于数据驱动的方法，为矿业勘探带来了新的思路和可能性。

然而，矿业是一个极为保守的行业，投资者对AI预测矿藏的技术持怀疑态度。为了验证其预测的准确性，Earth AI决定自行开发钻探设备，并进行实地钻探测试。这一举措不仅展示了公司的决心和实力，也为其赢得了更多的信任和认可。

值得一提的是，Earth AI于2019年进入Y Combinator孵化器，经过多年的研发和努力，今年1月成功完成了2000万美元的B轮融资。这笔资金的注入，将为公司的进一步发展和扩张提供有力的支持。

相比其他AI勘探公司，Earth AI采用了更高效的算法，能够快速扫描大面积区域，发现隐藏的矿藏。特斯柳克表示，传统的矿产勘探需要几十年的时间，而现代世界的发展速度无法等待如此漫长的周期。AI技术的出现，正在改变整个矿业的格局，为行业的快速发展注入了新的活力。

开源开发者巧施妙计，与AI爬虫“斗智斗勇”

AI爬虫被许多开发者视为互联网的“蟑螂”，对开源软件（FOSS）社区的影响尤为严重。面对那些无视robots.txt规则、伪装身份、恶意抓取的AI机器人，开发者们正在以巧妙甚至带有幽默感的方式进行反击。

FOSS开发者Xe Iaso开发了一款名为Anubis的反爬虫工具，它基于工作量证明（PoW）机制，在AI爬虫访问Git服务器前设置挑战，确保只有人类用户可以通过。如果人类用户成功通过挑战，他们将会看到一张可爱的动漫角色作为奖励，而爬虫则会被拦截在外。Iaso解释说，Anubis的名字源自埃及神话中的冥界审判之神，它会衡量亡者的灵魂，并判定其命运，这也寓意着该工具能够对爬虫进行“审判”。

这一项目迅速在开源社区传播开来，仅上线几天，就在GitHub上收获了2000颗星标，引发了众多开发者的共鸣。另一名开发者Venerandi透露，一些项目甚至不得不封锁特定国家的IP地址来抵御恶意爬虫的侵扰。

除了Anubis之外，一些开发者还选择了更具“复仇”色彩的方式来对抗爬虫。例如，一款名为Nepenthes的工具会引诱爬虫进入虚假内容的迷宫，让它们陷入无用数据的循环中无法自拔。而Cloudflare也推出了AI Labyrinth，通过投喂无关信息来迷惑AI机器人，使其无法获取有用的数据。

尽管有开发者呼吁彻底抵制AI爬虫，但在现阶段，FOSS社区正以创意与幽默为武器，展开了这场反爬虫之战。开发者们用智慧和幽默感守护着开源社区的净土，让互联网更加美好。

Twin发布首个AI智能体：为Qonto客户自动检索发票

近日，位于巴黎的初创公司Twin发布了其首个AI智能体——发票操作员，旨在为Qonto客户自动化检索发票。Qonto是一家提供企业银行账户服务的金融科技公司，服务超过50万欧洲客户。此次推出的AI智能体与Qonto合作，旨在解决客户每月花费数小时手动收集并上传发票的问题。

发票操作员通过自动化工具加速这一过程，首先获取缺失发票的交易列表，并展示需要访问的服务。用户若需登录服务以下载发票，系统会暂停并要求手动输入凭证。一旦输入完毕，AI智能体便继续操作，自动下载发票并将PDF文件上传至Qonto账户。

Twin联合创始人兼CEO Hugo Mercier表示，与传统的RPA（机器人流程自动化）方法相比，AI智能体可以更高效地处理成千上万种不同的服务，而不必针对每个网站创建定制脚本。他还提到，虽然类似Zapier的API自动化产品用了十年时间支持8,000个应用，但Twin仅用几个月便为发票操作员支持了成千上万的应用。

目前，Twin采用基于Chromium的浏览器和OpenAI的CUA（计算机使用智能体）模型，并计划将AI智能体扩展到其他B2B应用，如自动管理订单或为呼叫中心提供信息。Twin的目标是让AI智能体在更广泛的任务中变得更便宜、更快速且更精准。

纵观资讯

AI商业洞察 | Anthropic揭秘AI思维新发现：会提前规划，甚至偶尔“撒谎”

热门标签

热门排行

最新更新

友情链接