公司动态
返回

类人AI 50 Topics Part 8

作者: CEO 钱小一  2017-10-31
Topic40C&R子系统
C&R是conditon & reaction的缩写。反思我们自身,我们会发现我们的行为模式被这样的信息片段所组织,简单来说就是——在什么条件下做什么,宏观行为如何去做。
C&R子系统的职责就是驱动这类信息创造行为。
我们先来看下C&R在整个系统中的位置。C&R的上端是情绪系统的计划模块(plane)。情绪系统在对conscious flow(意识)中idea点子评估了效用之后,就会决定是否要立即执行它或是写入到计划中,而计划模块则是在计划的条件成熟时,通知C&R去执行。
整个C&R是一个倒立的金字塔的结构。最底层的是很有限的基础行为,比如“拿A到B”、“走到A”、“看A”,这些基础行为被组织为中间层的宏观行为,比如“拿抹布擦地”涉及“拿抹布”、“走到水槽”、“清洗抹布”、“拧干抹布”、“擦地”等底层行为的组织;而这些中间层的行为又可以被更上层的宏观行为组织,比如“打扫房间”就包括了把“扫地”、“把东西放到应该放的位置”、“拿抹布擦地”等其他宏观行为。



Topic41、最基础的结构——条件-执行
C&R中行为组织有一个最基本的结构,就是:条件-执行。 
我们先来看下列的表述。
比如“看到同事告诉他明天不用来上班。”“用杯子接完茶水后把杯子给peter”。“到了路口如果看到巨大的广告牌,则向右转”,“每周五要打扫屋子”。这些条件-执行片段中的条件是从conscious flow(意识)或“感知但未必意识的信息”中捕获的。在上面的例子中“看到peter”、“用杯子接完茶水”、“到了路口看到巨大的广告牌”、“每周五”这些信息发生的时候会被写入到conscious flow(意识)中,写入的信息未必直接是这些条件节点,有可能是它的子类。利用系统固有的前置服务中的统辖检测,系统会知道对应的条件发生了。
在上面的例子中我们看到条件-执行中有些“执行”是需要更细致的定义的。比如:“告诉他明天不用来上班”“打扫屋子”。我们把这些还需要分解的行为叫做“宏观行为”,把无法继续分解,行为的执行信息直接能够点亮设备的,叫做“基础行为”。很自然的思路我们要去考察行为的分解。
/var/folders/8h/0vw6zv095xd3ktfs275f7qt00000gn/T/com.microsoft.Word/WebArchiveCopyPasteTempFiles/gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAAAABCAYAAAAfFcSJAAAADUlEQVQImWNgYGBgAAAABQABh6FO1AAAAABJRU5ErkJggg==
Topic42、行为的分解
我们考虑这样的宏观行为:
“人给对象倒一容器饮料”
1、人先找到容器
2、人拿容器到接饮料地方
3、人用容器接一杯饮料
4、把容器交给对象。
“人给对象倒一容器饮料”是一个宏观行为节点,下面的4个步骤是这个宏观行为组织的子行为节点。子行为节点有可能仍然是一个宏观行为节点,能够继续向下分解;也可能不能够就向下分解,也就是一个基础行为节点。当然这个例子中宏观行为对基础行为的组织是一个顺序结构:也就是后面行为的触发是以前面一个行为的结束为条件。顺序结构只是一种特殊情况。
任何一个宏观行为可以描述为这样的形式:
如果要进行宏观行为A,你需要先进行行为B,如果条件C则进行行为D,如条件E则进行行为F……。因为每个行为节点可以继续展开,我们会发现这种条件-执行的结构加上行为的嵌套是可以用来表述绝大部分的宏观行为是如何被组织的。比如顺序结构中一个行为开始的条件,就是上一个行为的结束,我们可以想象有一个节点在上一个行为结束时被点亮,而这个节点就是下一行为的条件。
 
Topic43、抽象+演绎——AI学习一类任务的过程
我们来考察类人AI如何从观察人类执行某个具体任务,举一反三,学会一类任务的执行的。如果AI能够通过语言或视觉识别到下面的人类给某个对象准备饮料的过程: 
Mike给peter倒一杯热水。
1、mike先找到一次性杯子
2、mike拿它到饮水机
3、mike再用它接一杯热水
4、把杯子交给peter
首先如果把mike换成自己,则这个信息就是自己如何“给peter倒一杯热水”应该做的。但这个观察到的信息在认知态会发生的反应不止这些。
前面我们有讨论过认知系统抽象的功能。如果抽象过程发生我们看这个信息会发生怎样的变化。抽象过程至少会产生以下这样的信息:
按照约束映射进行抽象:mike-人;peter-对象;热水-饮料;杯子-容器;饮水机-接饮料的地方。



任务:“人给对象倒一容器饮料”
1、人先找到容器
2、人拿容器到接饮料地方
3、人用容器接一杯饮料
4、把容器交给对象。
当出现一个新的任务的任务比如“AI给王总倒碗茶”。就会利用认知系统的演绎功能创造具体的执行程序信息。



任务:“AI给王总倒一碗茶”
1、AI先找到碗
2、AI拿碗到接茶的地方
3、AI用碗接一杯茶
4、AI把碗交给王总。
从整体来看在上面的例子中AI能够从一个表象层宏观行为如何进行的范例的认知态信息中进行抽象,生成应对一类行为信息。再借助演绎功能在具体场景中生成具体的执行信息,表现得具有举一反三的能力,能从一个表象学会执行一类的任务。



Topoc44、行为目标驱动的关注
在一个智能体中会保存海量的宏观行为的具体执行信息,也就是宏观行为是如何被分解的。我们可以想象在海量的执行信息中有海量的条件节点,这些条件需要感力进行分辨,而感知力是非常有限的资源。
前面我们描述过,区别于conscious flow(意识),有一类信息叫做“感知但未必意识的信息”。比如我坐在图书馆窗前看书,窗外有鸟在飞,有汽车,天下着小雨,边上有不同的人走过,这些信息是被我正感知的,但我不会把它们放到意识中,所以不会进一步运算它。但如果一个信息可能和我的一个执行相关,我就会对它有额外的关注,我会用我的感知行为注视它、听它。
延续上面的语境,比如我早上看到mike穿着鲜艳红色的衣服,而现在我被告知“看到mike告诉他明天不用来上班”。这里的问题是“看到mike”这个条件如何获得。假设这个时候如果边上走过一个穿着鲜艳红色的衣服的人,区别其他“感知但未必意识的信息”,这个信息有足够的关注度,我会抬头去看这个人。
在机制层面这个过程大致是这样的:因为mike参与到了系统的一个行为中,所以就获得了很高的关注度,而mike相关的特征也具有了关注度,这使“穿鲜艳红色衣服的人”这样的信息虽然“感知但未必意识”却会触发观察反射。而观察反射则会使系统“看到mike”。
在人身上我们能够理解,感知力是有限的资源。如果我们观察peter一天的行为,我们就不能观察Mike的行为;如果我们集中注意在搜索看到的红色物体,也就削弱了我们搜索其他颜色物体的效率。
所以我们会对条件节点进行分类:被关注的条件节点不被关注的条件节点。如果一个宏观行为节点被点亮,也就是被决策的是要执行的。那么旗下的条件节点是被关注的条件节点。条件节点中相关的对象是被关注的。



Topic45、二态性统一
在理想状态的类人人工智能系统下:首先组织行为、思维、和语言模式的信息是一种数据信息,这些信息能够在一个模块下被驱动转为行为、思维和语言表达。更进一步这种数据信息虽然作为一种程序信息,但它的形式是应该和作为认知态的信息一致的。延续前面的例子:
给peter倒一杯水,包含了
1、先找到一次性杯子
2、拿它到饮水机
3、再用它接一杯
4、把水交给peter
首先这些信息作为一种数据形式A进行保存,信息在A形式下是可以被驱动模块驱动创造这个行为的,我们把这种状态的信息称为程序态的信息;而当我对类人AI描述如何给peter倒杯水时,也会生成同样语义的信息,假设信息是用B形式表达的,我们把这种状态的信息称为是认知态的信息
对于人而言,我们知道我们是可以把这两种形态的信息自由转化(或是它们的形式本身就是一样的)——一个人和可以另外一个人去讲解如何去做一件事情,那个人能够根据讲解去执行,这是信息从认知态向程序态的转化;而一个人如果会做某件事情,他也有能力把如何做这件事情的程序表达出来,这是信息从程序态向认知态的转化。我们把这种相互转化的能力叫做程序态信息和认知态信息的二态统性统一
类人人工智能这种二态性统一在逻辑仿生的思维工程中是必要,它是很多高级智能功能所需要核心机制。



Topic46、二态性统一的意义
当信息能够从认知态转为程序态,意味着任何创造这个认知态信息的源头可以最终导致对象能够进行对应的行为。根据创造认知态信息的源头进行分类,我们就有:
1、自然语言能够通过转为认知态的信息再转为程序态的信息。也就是你可以通过描述来教会类人AI如何做一件事情。
2、类人AI观察对象如何做一件事情,假设深度学习的技术足以支持人类行为模式的识别,这个时候信息也是先作为认知态的信息形成,然后转为程序态的信息。也就是类人AI能够在观察和效仿下学会做一件事情。
3、类人AI自己会利用知识对目标进行分解,寻找计划,在对一些子目标不清晰的时候会主动询问,最终形成一个可执行的计划。这个计划一开始也是认知态的,然后能够转为程序态被执行。也就是类人AI能够通过认知系统计划如何完成一个目标然后执行。
反过来,当信息能够从程序态转为认知态,意味着类人AI能够把自身的具体的行为、思维、语言表达的过程作为认知客体,在认知系统中进行认知和修正。这里有一个在既定的目标下连接计划-实践的反馈环,它几种不同的形态,比较容易在工程上再现的包括:
1、就目标利用认知系统创造计划。在实践中评估计划对于目标的实现的确定性,并搜集信息。基于计划的实践信息,会形成既有计划优化的认知,用这个认知修改计划,再进行实践……
2、无论行为、思维还是语言,都是模式化组织和条件反射某种结合,比如在实现某种行为目标上你有一个计划或是一个既有的模式,计划和模式只控制主要流程的发生,但这个过程中会有一些预期外的事件,这个时候智能系统会用零散的反射信息去应对之,反射的内容和当时智能体的状态有关。最终认知系统如果反思到这种带有一定“随机成分”的反应贡献于或者负贡献于目标。则会调整既有的模式,或是调整创造计划的相关的信息。举个例子比如你会具有如何安慰一个人的表达模式,但在安慰人的过程中对方的一些反应比如突然嚎啕大哭是你之前没有遭遇的,这个时候虽然有些手无足措,但你会选择你反应,你会观察这个反应的效果,并选择是否把这个反应纳入安慰人的模式中。 
上面这个连接计划(模式)-实践的反馈环是人类所具有的,它使人类在处理特定的任务上能够从菜鸟变得精通纯熟,它使人类群体的智能显得有高有低。但计算机载体的智能体会具有一个额外的反馈环,也就是《思维工程导论》中描述的通向强智能的反馈环。这个时候反思客体不是具体的行为、思维、语言而是创造它们的背后的机制,如果这个反思力在某个维度超越作为创造者的人类,就可以在人类创造的A状态给出一个更优的B状态,把自己修正到B状态。因为B状态优于A状态,所以基于B状态给出的更优的C状态会优于B状态……于是形成一个自我增强的反馈环。
也就是说强人工智能不是人类创造的,人类仅仅给了它一个自我迭代的起点,它形成于后续的自我迭代中。这个反馈环之所以无法在人类身上实现是因为人类即使意识到自身在智能机制层上的缺陷,也无法去进行优化。但计算机上的程序不会有这样的限制。
  • 扫一扫关注微博
  • 扫一扫关注微信
联系方式
联系电话:0571-86656253
商务合作:137-9512-3159
E-mail:business@galaxyeye-tech.com
地址:杭州市滨江区长河街道滨安路650号 ix-work A幢2302

©2015. All Rights Reserved. 杭州北冥星眸科技有限公司 浙ICP备15033409号