亿鸽在线客服系统
物联网开发

让OpenAI大牛直言才是未来的AI智能体是什么

    前段时间,前特斯拉总监、OpenAI大牛Karpathy的一句话,引起了业内的关注。


    在7月初的一次开发者大会上,Karpathy声称:“我被自动驾驶分了心,AI智能体才是未来!”并表示将来会全力投入对智能体的研发工作中。


    其实,早在2016年,当Karpathy开始在OpenAI工作时,就已经锚定了智能体的方向,只是由于当时的研究方法还不成熟,所以Karpathy才转去做了自动驾驶。


6A78C11337BF10A6C8A9723C33F01D4CAE678022_size39_w740_h460.png


    那么,这所谓的“智能体”究竟是什么?为什么会让这位AI大牛长久地念念不忘?


    何谓智能体


    到底什么是智能体?


    如果我们将现在的生成式AI,比作一个人的话,那么它只具有了大脑(大语言模型),但却没有身体,因此只能躺在服务器上,做一些处理文字、生成图片的工作。


    而智能体,就相当于是大模型的“身体”,有了它,大模型才能在更多的领域施展身手。


    那智能体究竟能做什么?


    最近,一个名叫Fable的初创公司,发布了一个节目统筹智能体(Showrunner),如同一声惊雷炸响,让人们再次见证了智能体的强大。通过这样的智能体,Fable制作出了一集完全用AI拍摄的《南方公园》!从编剧、动画、导演、语音、编辑……到剧集制作的全流程,都是由AI完成。


    在整个制作环节中,通过自然语言,给不同的智能体分配了各自的目标,人类导演只需要给出一个高层次的构思提示(标题、概要、事件),这些AI智能体就会开始「自导自演」。之后,人类几乎就不用进行任何干涉了!


    在制作过程中,不同的AI智能体,担任了不同的角色,如演员、导演、剪辑等,它们彼此分工合作,互相配合,最终完成了整部影片的制作。而同样的,类似的案例,也出现在前段时间清华团队的研究中。


    7月19日,清华团队用ChatGPT打造了个零人工含量的“游戏公司”——ChatDev,只要你提出想法,从设计到测试的完整流程,都由AI帮忙搞定。


    Fable与制作《南方公园》的思路类似,在游戏开发的环节中,ChatDev的十多个智能体也分别担任了这个“公司”中的策划、程序员、设计师等不同的岗位。


    在项目开始时,人类可以对这些AI提出一个大概的想法或创意。之后,各个智能体之间就会进行一系列讨论、制作、测试的环节,整个过程完全不需要人类的参与,全是自动进行的。由此可见,有了智能体之后,大模型就能根据人类给出的规则和策略来做出决策,而不需要人类的干预或指令。


    在这个过程中,智能体还会通过习得的经验或知识,来改善自己的性能和适应性,并根据目标函数或奖励函数来评估自己的行为。


    而这样的能力,是以往的大模型(LLM)无论如何都不具备的。


    因此,LLM即使再聪明,也是一个没有身体的“大脑”,而正是智能体的出现,让LLM有了行动的能力,有了自主完成复杂任务的能力。


    而这样的能力,正是LLM下一阶段进行在应用层面进行落地的关键。


    AI智能体需要从神经科学中汲取灵感


    就像深度学习早期的发展一样,AI智能体的发展可能会从神经科学中获得启发。


    思考AI智能体和神经科学的关系是很有意思的。


    尤其是现在很多人都把大语言模型作为AI智能体解决方案的一部分。


    但是如何构建一个完整的,拥有人类所有认知能力的数字实体呢?


    显然,我们都认为需要某种潜在的系统来规划、思考和反思我们在做的事情。


    这可能就是神经科学能发挥作用的地方。


    举个例子,海马体是大脑非常重要的部分。


    但是AI智能体中什么东西发挥着海马体的作用,来存储记忆,实现标记和检索等等的这些功能呢?


    我们大致已经了解如何构建视觉和听觉皮层,但还有许多的东西我们并不知道在AI智能体中到底意味着什么。


    比如潜意识的所在地——丘脑在AI Agents中又相当于什么呢?


    这些都是非常有趣的问题。


    我专门带了一本神经科学方面的书,是有David Eagleman的《大脑与行为》,我发现这本书非常有趣,很有启发性。


    就像早期AI研究在设计神经元时所做的那样,从神经科学中汲取有趣的灵感,也许是我们应该重新尝试的方向。


    无论是人类智能体还是机器人智能体,它们都以不同的传感器和执行器来与环境进行交互。


    智能传感器和执行器是主要零件


    对于人类智能体而言,我们拥有眼睛、耳朵和其他器官作为传感器,以及手、腿、声道等作为执行器。通过眼睛观察周围的景象,通过耳朵聆听声音,我们能够感知环境。而通过手和腿的动作,我们可以对环境做出反应和影响。


    机器人智能体则通过不同的传感器来感知环境,例如摄像头和红外测距仪。这些传感器帮助机器人了解周围的世界。同时,机器人还配备了各种电动机作为执行器,通过这些执行器,机器人能够对环境进行实际的操作和动作。


    除了具有物理实体的智能体外,还存在着软件智能体。软件智能体不像机器人那样有实体存在,它主要通过计算机程序来感知和操作环境。软件智能体可以接收来自文件内容、网络数据包和人工输入(例如键盘/鼠标/触摸屏/语音)的传感输入。然后,它通过写入文件、发送网络数据包、显示信息或生成声音等方式对环境进行操作。


    智能体的传感和执行过程是人工智能的核心,使其能够在不同领域发挥重要作用。通过传感器感知环境和通过执行器作用于环境,智能体能够做出决策和响应,从而实现智能的行为。


    总结来说,智能体是通过传感器感知环境并通过执行器作用于该环境的实体。无论是人类智能体、机器人智能体还是软件智能体,它们都通过不同的传感器和执行器与环境进行交互,从而表现出智能的行为。这个简单而重要的概念是人工智能研究和应用的基石。


    郑州博观电子科技有限公司是一家提供科技类物联网开发软硬件定制化方案服务商、也是中原地区领先的物联网终端设备解决方案提供商。致力共享换电柜、智能充电桩、共享洗车机、物联网软硬件等服务平台的方案开发与运维。总部位于河南省郑州市高新区,已取得国家高新技术企业认证证书。经过10多年的业务开拓,公司已经形成了以中原地区为中心、业务遍布全国的经营格局。


注:本站文章部分文字及图片来自互联网。如有侵权行为,请联系我们,我们会及时删除。