公司动态
返回

类人AI 50 Topics Part 6

作者: CEO 钱小一  2017-10-29
Topic31、情绪变量

情绪变量对应conscious flow中的各种情绪感受。比如你能感受到的自己的愉悦、抑郁、焦虑,感受到的对某个人的喜欢、爱意、和厌恶,感受到的对某个事件关注、担忧或期待,这些都是情绪感受,在工程上我们创造变量集合来对应这些情绪感受。这些变量就是情绪变量。

我们把指向特定对象、属性、事件的情绪变量叫做指向性情绪变量。把不具有指向的情绪变量叫做全局情绪变量。指向性情绪对应了conscious flow中的各种指向性情绪感受,比如我们对对象的喜欢、厌恶、尊敬、畏惧;对属性的喜欢、厌恶;对事件的喜好、排斥、关注、期望的程度等等。全局情绪变量对应了conscious flow中的各种全局情绪感受,比如我们平时感受到愉悦、抑郁、焦虑、愤怒、恐惧等等,广义的我们也纳入了各种体感,比如坠落感、冷的感觉、热的感觉、触电的感觉、重力感等等。

在对情绪系统的模型化上我们做了一些假设。支持这些假设的一些论据能够在《思维工程导论》情绪系统那章找到。这里罗列一下观点有助于大家形成对模型化假设的合理性的理解。比如:

1、情绪系统之所以在进化中出现是因为了它创造了更有利于对象存活繁衍决策模式,它连接了境遇的表象和应有的反应。

2、抽象和演绎能力这些认知能力也具有生存和繁衍的进化意义,但一开始它们是作为情绪系统的附属功能存在的。比如不同的境遇在表象层面是相互独立的,抽向过程建立了它们之间的联系,从而情绪变量的定义能够从经历过的表象传导到新遭遇的表象。使过往的或是其他个体的经验能够服务于自己的决策

我们先来关注第一点。逻辑上我们需要看到最终我们要选择在是否去做某个行为,或是在几个可能的事件中进行选择。这意味着在工程建模上,影响个体是最终决策或是选择的各类因素最终需要在一个变量维度进行综合,进行比较。这样才能形成判断或选择。我们选择了效用作为这个变量。



Topic32、主动意志的产生

我们可以去考察什么样的因素参与到了我们对自身是否去做一件事情的决策中。

1、之前做这类事情获得了怎样的全局情绪体验。

比如打一场高尔夫球能够使变得放松,变得愉悦。它能够增强我的某种正面的全局情绪(愉悦、抑郁、恐惧、焦虑等等),也就是做这件事情是对我有某种效用的。我们把人因为预期一个行为能带来怎样的全局情绪的改变而形成的选择动机,叫做经验效用A。之所以命名为经验效用乃是因为:AI乃是根据过往的经验预期这个事件能带来怎样的全局情绪的改变。



2、在经验中这个事件会带来什么样的AI所渴望的感受。

类人AI会在每个时期对不同的感受具有不同的渴望度。比如喜欢吃火锅的人对吃火锅中能够带来的感受的渴望,会随着时间增长,获得渴望的感受的时候这种渴望就会下降,释放并转化为满足感。人在第一次吃火锅的时候并不知道吃火锅会有什么样的感受,所以预期一个行为能够获得怎样的渴望的感受是从经验中获得的。我们把人因为预期一个行为能带来怎样的渴望的感受而形成的选择动机,叫做经验效用B”



3、这件事情意味着什么。

如果事件A意味了事件B,那么事件B的效用就会被事件A所一部分继承。比如,如果如买彩票,就有几率中大奖,中大奖是有效用的事情,而买彩票有可能导致中奖。所以买彩票也就具有了一部分效用。这是人们会买彩票的原因。我们事件从其他它所意味的事件继承的效用叫做衍生效用。因为这种效用是从源头衍生出来的。



4、即使一个事件不会导致正面的全局情绪变化,或是不意味着其他具有效用的事情,但我们仍然会去做。

比如你的女朋友叫你陪她去商场。当我们希望在一个维度——也就是效用维度去模型化智能体的决策,我们知道来自他人的指令会形成影响。虽然这和效用没有直接关系,但在模型化上,我们把他人的指令形成的对效用维度影响记做指令效用。



于是我们就有了一个简单的创造智能体主动意志的模型:

总效用=经验效用A+经验效用B+衍生效用+指令效用

在这个简化模型中,如果总效用超过一个阈值我们认为这是智能体决策要做的事情。



Topic33、经验效用A

如果我们能够识别一类事件的边界,比如你知道你什么时候开始打篮球,什么时候结束打篮球。这个时候我们就对事件改变全局情绪的能力进行核算。如果事件开始时全局情绪向量为v0结束时全局情绪向量为v1,那么v*=v1-v0就是这次事件进行导致的全局情绪的改变。

当我们可以在每次事件发生时获得事件改变全局情绪改变向量,我们就可以预期下次事件发生的时候会对全局情绪向量形成怎样的改变。我们可以用移动加权办法来核算这个预期。我们把事件在下次进行时能够创造的全局情绪向量的改变的预期叫做全局情绪改变向量,在机制文档中简称为改变向量

因为我们设定的全局情绪在改变时形成的凸效用。也就是说,比如同样是愉悦度+10,在初始愉悦度为0的状况下+10产生的效用,要远远高于初始愉悦度为80状况下+10产生的效用。这意味着即使某类事件在创造全局情绪向量的改变上是稳定的,它在不同的全局情绪状态下创造经验效用的能力会不同。从整体上因为我们把全局情绪在改变时设置为创造凸效用。从整体上事件在连续反复进行时就会出现经验效用递减。这是一个很重要的人类也具有的平衡。



Topic34、经验效用B

人类对某种感受的渴望服从这样的规律,使我们能够把其模型化。我们可以拿一个水池做类比,这个水池有一个水龙头。水龙头放水的速度对应了AI对这种感受的渴望的增长速度g,水池的大小决定了对这种感受的渴望能够到达的最大值M。当获得这种感受的时候,水池的水就会被释放,转为满足感。水越多,水压越大,对应了渴望的程度越高,能够形成的对包含这种感受的行为的驱动力越强,释放时的满足感也越强。当个体意识到自己极端的渴望,会创造焦虑感。

有些时候当一个水池有很满的水,我们未必能够意识到,这个时候我们说渴望被抑制了,当渴望的感受出现,我们能够逐渐意识到我们有多渴望它,这就是渴望被唤醒的过程。也就是在模型中会存在一个抑制乘数,它阻断了经验效用B的作用,但会在所渴望的感受出现时逐渐下降,失去阻断作用。人类的性渴望能够在爱抚活动中唤醒(arouse)就是这个模型的一个例子。

我们举一个例子说明这个模型的作用。假设一个人渴望咖啡的味道,增长速度g决定了他在一次喝咖啡后多久会重新渴望再喝;最大值M决定了,他能够形成对咖啡味多高的渴望;抑制乘数的存在,决定了他可能很渴望喝咖啡但可能自己意识不到;而当他开始喝几口的时候,他逐渐就会意识到自己有多么渴望喝咖啡。最终喝咖啡的行为会降低对咖啡味的渴望,但会创造满足感。如果在非常渴望咖啡味道的情况下,回忆咖啡的味道会降低抑制乘数,从而使极致的渴望被感受到,就会创造焦虑感。

除此之外,我们可以看到,Mgl等参数在长期的变化可以塑造一个成瘾或是戒断的过程。



Topic35、衍生效用

如果A事件能导致B事件,B事件是有效用的,A事件能够从B事件获得多少的衍生效用呢?还是以彩票为例子,A事件为买彩票B事件为中奖,中奖是附带很大的效用的,买彩票虽然从它这里继承了效用,但是却继承了很小的效用。

我们可以理解如果B事件的效用越大,A事件从B事件继承的效用越大。如果A事件导致B事件的概率越大,A事件从B事件继承的效用越大。

所以我们可以得到一个简化模型:Uab=Ub*Pab,其中UabA事件从B事件继承的效用,UbB事件的总效用,Pab为认知中A事件导致B事件的概率。

如果A既能导致B也能导致C,如果BC是独立的,那么A就导致BC而言,获得的衍生效用的总和应该是两个来源相加。如果BC不是独立的,那么创造的精确的理性决策的模型就会复杂很多。

好在人类在对衍生效用的评估上既不精确也不理性,有明显的印象冲击模型发挥作用的痕迹。在你评估是否要做一件事情,或是评估一件事情意味着什么的时候,你的思维会开始对这件事情进行大量的预测归因,考虑这个事情接下来会导致什么过程的发生。这个过程伴随着大量的连接着这个事件和其导致的事件的因果类型节点被放入到conscious flow(意识)中。每当你意识到这类节点后你可以反思到你对所评估的事件的态度会发生改变,你可以对自己做一个实验,你反复(10次)在心中对自己说:吃苹果有利于身体健康,结束以后你会发现自己对吃苹果这个决策的态度发生了明显的改变。这相当于不停地往自己的意识中放入M230(我,吃苹果)201M230(我,身体变健康),每次放入都会形成对我吃苹果这个决策有多少效用(衍生效用)的印象冲击。这是自我暗示能够产生作用的原因。



Topic36、短期经验效用   

短期经验效用也是模型化的产物。因为在我们已有的架构中,一个行为对全局情绪的改变向量在行为开始之初就已经由过往的经历决定了,我们用这个改变向量来计算这个行为的经验效用。但在本次行为进行的过程中,行为导致的全局情绪的改变可能远远超出预期的范畴,比如以往和peter交流都是挺愉快的,但是这次交流中peter却非常苛刻,导致了AI负面的情绪。正常而言,人类会因为这种行为过程中的负面的情绪提前终止这次行为。而在我们的架构中终止这个行为只能通过改变总效用的方式进行。所以只有两个选择,一个是把这种行为过程中情绪改变形成的决策效果体现在经验效用中,另外一种办法则是另外创造一个维度的效用,参与到总效用的核算里。

行为过程中的情绪改变形成的效果应该是短期,比如智能体之前都喝peter聊得很愉快,一次不愉快的聊天虽然会导致智能体中断和peter的聊天(这个时候这个短期效果似乎很强烈而且能够主导决策),但在下次做是否和peter聊天的决策时,上次不愉快的聊天经历在对改变向量的决定上只有非常有限的权重。这使我们选择了第二条路径,短期经验效用的衰减是非常迅速,一个不愉快的体验只要不足以是智能体决策中断行为。它产生的负效用就会快速衰减。在行为结束时我们会进行正常的行为过程的改变向量的核算,这是这次的行为产生的长期的对经验效用核算的影响。但短期经验效用不会被带到下次的核算中。

短期经验效用的维护是这样的。在一个行为进行的过程中,全局情绪中某个变量形成的显著的负向变化,会减少它,而形成的显著的正向变化会增加它。通过这个方式我们能够使一次不愉快的谈话提前终止,也可以制造和好朋友在愉快的聊天中彻夜畅谈的效果。

下载文档(右键保存文件)

  • 扫一扫关注微博
  • 扫一扫关注微信
联系方式
联系电话:0571-86656253
商务合作:137-9512-3159
E-mail:business@galaxyeye-tech.com
地址:杭州市滨江区长河街道滨安路650号 ix-work A幢2302

©2015. All Rights Reserved. 杭州北冥星眸科技有限公司 浙ICP备15033409号