当前,互联网搜索引擎中出现了越来越多的人工智能(AI)聊天机器人,如谷歌的Bard、微软的Bing等。这似乎将要改变科学搜索引擎。
据《自然》报道,8月1日,荷兰出版业巨头爱思唯尔向其Scopus数据库的部分用户发布了一个基于ChatGPT的AI界面。当天,英国数字科学公司(Digital Science)也宣布为其Dimensions数据库的AI大语言模型(LLM)进行封闭试验。美国科睿唯安公司还试图将LLM纳入其Web of Science数据库。
用于科学搜索的LLM并不是什么新鲜事物,Elicit、Scite和Consensus等初创公司已经推出了此类AI系统,即依靠免费的科学数据库或通过与出版商合作的方式访问付费的研究论文,从而帮助总结某个领域的发现或识别顶尖研究。
现在,拥有大型科学数据库的公司也加入其中。
爱思唯尔作为试点推出了名为Scopus AI的聊天机器人。负责该工具开发的Maxim Khan说,作为一个轻便、有趣的工具,Scopus AI旨在帮助研究人员快速获得不熟悉的研究主题的摘要,其使用LLM GPT-3.5版本可以获得一段关于该研究主题的流畅总结、引用的参考文献以及需要进一步探索的问题。
但学者对LLM的担忧是,它们是不可靠的。LLM只是通过输出文本上看似合理的词语来工作,输出的内容可能包含事实错误和偏见,甚至还会编造出不存在的参考文献。
因此,Scopus AI只能通过参考5至10篇研究摘要来生成答案。爱思唯尔还限制Scopus AI仅搜索2018年后发表的文章,以获取最近的论文,并指示其在回复中适当引用摘要,以避免不安全或恶意的查询。这虽然不能完全避免错误,但可以最大限度减少错误。
那么,用户是否会将机器人生成的段落复制粘贴到论文中,从而对内容进行抄袭?Khan表示,这是有可能的。不过,爱思唯尔通过“指导意见”来解决这一问题,要求研究人员负责任地使用摘要。资助者和出版商也发布了类似的指导意见,要求公开透明地披露LLM是否用于撰写论文或进行同行评审,或者在某些情况下声明不应该使用LLM。
目前,Scopus AI仅向约1.5万名用户推送。爱思唯尔表示,该工具预计将于2024年初全面开放。
Dimensions数据库引入AI助手同样只针对选定的测试者。在用户输入问题后,搜索引擎首先检索相关文章,然后开放的AI GPT模型围绕已检索到的排名靠前的摘要生成摘要段落。Dimensions还使用LLM提供了相关论文的更多细节,包括研究结果的简短总结。
数字科学公司首席产品官Christian Herzog说,公司希望在今年底前在更广泛的范围内发布该工具,目前正在与科学家、资助者和其他使用Dimensions的人合作,测试LLM在哪些方面可能有用。他说:“这关乎逐渐适应一项新技术并信任它。”(文乐乐)