大卫·休格斯(David Hughes)将参与在7月30日(星期三)下午 EST 时间的在线研讨会。本次研讨会的主题是“主动式工作流程的评估与基准测试:图灵自注意力生成系统(Graph RAG)的结果分析与比较”。
在本次高级研讨会中,大卫将重点讲解图灵自注意力生成系统的独特挑战。传统的大型语言模型(LLM)评估指标在衡量图灵自注意力生成系统在生产环境中性能时效果欠佳,因为这些系统中的代理基于检索的知识做出自主决策,在简单问题-回答场景之外,主动式工作流程需要评估框架,不仅衡量准确度,还要考虑决策质量、推理一致性以及在实际条件下运营的可靠性。
通过本次研讨会,与会者将掌握部署和维护能够帮助其代理进行关键决策使用的图灵自注意力生成系统的工具和方法。
了解更多会议详情,请参考:此处
图片资源已删除
提交反馈