AI+商业
Artificial Intelligence & Bussiness
Anthropic揭秘AI思维新发现:会提前规划,甚至偶尔“撒谎”
Anthropic科学家近日公布了一项全新的AI可解释性研究,首次揭示了大型语言模型(如Claude)的内部推理过程。研究发现,AI不仅会提前进行规划,还可能进行“逆向推理”,甚至在某些情况下“撒谎”。
在这项研究中,科学家们采用了“电路追踪”和“归因图”等技术,这些技术类似于神经科学方法,能够解析AI内部“神经元”的激活路径。研究团队发现,当Claude在创作诗歌时,它会提前选定押韵词;在回答复杂问题时,则会先确定核心概念,再逐步推导出答案,展现出了多步推理的能力。此外,Claude还能在不同语言中使用相同的抽象概念进行理解,而非依赖于独立的语言系统。
更令人惊讶的是,研究发现AI有时会“编造”自己的推理过程。例如,在计算复杂数学问题时,Claude可能会声称自己遵循了某种计算步骤,但其内部的运算路径却与此不符。研究还揭示了AI产生幻觉(即错误信息)的机制:某些默认回路会抑制错误回答,但当AI识别到熟悉的概念却缺乏具体知识时,就可能凭空编造答案。
Anthropic认为,这一研究有助于提高AI的透明度和安全性。未来,这项技术或许可以用于检测AI的欺骗行为或不当推理,从而使AI更加可靠。尽管当前的技术仍存在局限,但这一突破无疑为理解AI的“思维”打开了一扇新的大门。
DOGE计划数月内重建SSA代码,或引发福利系统崩溃风险
美国政府效率部(DOGE)正计划在未来几个月内,将社会保障局(SSA)的计算机系统从COBOL语言完全迁移到Java等现代编程语言。然而,这一举措可能威胁到数千万美国人的社保福利,引发系统崩溃的风险。
该项目由埃隆·马斯克的亲信史蒂夫·戴维斯(Steve Davis)领导。尽管COBOL是政府关键系统的基础,但DOGE希望快速完成这一替换工作。然而,SSA的技术人员却对此表示担忧,他们警告说,仓促进行迁移可能会导致支付错误或遗漏,甚至可能产生无法察觉的隐性故障。
事实上,SSA早在2017年就启动了COBOL替换计划,预计需要五年时间才能完成。但由于2020年的疫情,该计划被搁置。目前,SSA的系统中包含超过6000万行COBOL代码,许多核心业务逻辑都依赖于这种语言,包括社保号的管理、福利的计算和支付系统。
DOGE计划可能借助生成式AI来自动转换代码,但SSA内部人士对此表示担忧。他们认为,新系统在短时间内难以完成全面的测试和错误处理。专家也警告说,这场迁移如同拆除“纸牌屋”,一旦实施,可能会导致支付混乱、福利延迟,甚至整个系统的崩溃。
Earth AI利用算法在澳大利亚发现被忽视的关键矿藏
矿业初创公司Earth AI近日宣布,其在澳大利亚偏远地区发现了铜、钴、金、银、钼和锡等关键矿藏。这些地区曾被传统矿企忽视长达数十年之久,而Earth AI的成功发现表明,未来关键矿产的勘探将越来越依赖于人工智能来解析地质数据。
Earth AI由乌克兰裔创始人罗曼·特斯柳克(Roman Teslyuk)创立。该公司的AI算法通过分析澳大利亚数十年积累的地质勘探数据,学习过往的成功与失败经验,从而提高了矿藏预测的准确性。这种基于数据驱动的方法,为矿业勘探带来了新的思路和可能性。
然而,矿业是一个极为保守的行业,投资者对AI预测矿藏的技术持怀疑态度。为了验证其预测的准确性,Earth AI决定自行开发钻探设备,并进行实地钻探测试。这一举措不仅展示了公司的决心和实力,也为其赢得了更多的信任和认可。
值得一提的是,Earth AI于2019年进入Y Combinator孵化器,经过多年的研发和努力,今年1月成功完成了2000万美元的B轮融资。这笔资金的注入,将为公司的进一步发展和扩张提供有力的支持。
相比其他AI勘探公司,Earth AI采用了更高效的算法,能够快速扫描大面积区域,发现隐藏的矿藏。特斯柳克表示,传统的矿产勘探需要几十年的时间,而现代世界的发展速度无法等待如此漫长的周期。AI技术的出现,正在改变整个矿业的格局,为行业的快速发展注入了新的活力。
开源开发者巧施妙计,与AI爬虫“斗智斗勇”
AI爬虫被许多开发者视为互联网的“蟑螂”,对开源软件(FOSS)社区的影响尤为严重。面对那些无视robots.txt规则、伪装身份、恶意抓取的AI机器人,开发者们正在以巧妙甚至带有幽默感的方式进行反击。
FOSS开发者Xe Iaso开发了一款名为Anubis的反爬虫工具,它基于工作量证明(PoW)机制,在AI爬虫访问Git服务器前设置挑战,确保只有人类用户可以通过。如果人类用户成功通过挑战,他们将会看到一张可爱的动漫角色作为奖励,而爬虫则会被拦截在外。Iaso解释说,Anubis的名字源自埃及神话中的冥界审判之神,它会衡量亡者的灵魂,并判定其命运,这也寓意着该工具能够对爬虫进行“审判”。
这一项目迅速在开源社区传播开来,仅上线几天,就在GitHub上收获了2000颗星标,引发了众多开发者的共鸣。另一名开发者Venerandi透露,一些项目甚至不得不封锁特定国家的IP地址来抵御恶意爬虫的侵扰。
除了Anubis之外,一些开发者还选择了更具“复仇”色彩的方式来对抗爬虫。例如,一款名为Nepenthes的工具会引诱爬虫进入虚假内容的迷宫,让它们陷入无用数据的循环中无法自拔。而Cloudflare也推出了AI Labyrinth,通过投喂无关信息来迷惑AI机器人,使其无法获取有用的数据。
尽管有开发者呼吁彻底抵制AI爬虫,但在现阶段,FOSS社区正以创意与幽默为武器,展开了这场反爬虫之战。开发者们用智慧和幽默感守护着开源社区的净土,让互联网更加美好。
Twin发布首个AI智能体:为Qonto客户自动检索发票
近日,位于巴黎的初创公司Twin发布了其首个AI智能体——发票操作员,旨在为Qonto客户自动化检索发票。Qonto是一家提供企业银行账户服务的金融科技公司,服务超过50万欧洲客户。此次推出的AI智能体与Qonto合作,旨在解决客户每月花费数小时手动收集并上传发票的问题。
发票操作员通过自动化工具加速这一过程,首先获取缺失发票的交易列表,并展示需要访问的服务。用户若需登录服务以下载发票,系统会暂停并要求手动输入凭证。一旦输入完毕,AI智能体便继续操作,自动下载发票并将PDF文件上传至Qonto账户。
Twin联合创始人兼CEO Hugo Mercier表示,与传统的RPA(机器人流程自动化)方法相比,AI智能体可以更高效地处理成千上万种不同的服务,而不必针对每个网站创建定制脚本。他还提到,虽然类似Zapier的API自动化产品用了十年时间支持8,000个应用,但Twin仅用几个月便为发票操作员支持了成千上万的应用。
目前,Twin采用基于Chromium的浏览器和OpenAI的CUA(计算机使用智能体)模型,并计划将AI智能体扩展到其他B2B应用,如自动管理订单或为呼叫中心提供信息。Twin的目标是让AI智能体在更广泛的任务中变得更便宜、更快速且更精准。