我那“记性”超差的AI,终于被这个本地代理给治好了!

小编 3 0

说实话,你们有没有觉得现在市面上的那些AI助手,一个个都跟“鱼脑子”一样?

我可不是瞎说。上周我才跟某款大火的AI聊天软件抱怨完我对海鲜过敏,结果今天它竟然兴冲冲地给我推荐了一家“招牌辣炒海灵菇”的馆子。我盯着屏幕愣了三秒,然后默默关掉了对话框。心里那股火啊,蹭一下就上来了。这哪儿是人工智能,这简直就是人工“智障”嘛!你说咱普通用户图啥?不就图个省心吗?结果呢,记不住话、不懂规矩、每次对话都得从头开始,这种感觉就像你跟一个患有短期失忆症的朋友聊天,忒累了。

后来我跟一帮搞技术的朋友撸串,酒瓶子碰了好几个,我一拍桌子把这槽吐了个干净。其中一哥们儿抹了把嘴边的孜然,邪魅一笑:“你out了,现在真正会玩的人,谁还用那些云端公共的?我们都用那种‘长脑子’的本地代理,比如现在圈里挺火的那套东西,ai...小小-代理,就是你自己的电脑就能养一个,那记性,比我家门口看门大爷还好。”

我当时就愣了,啥玩意儿?AI还能自己养?

打破砂锅问到底:这货到底有啥不一样?

这一问,算是给我打开了新世界的大门。原来,这哥们儿说的ai...小小-代理,其实不是某个特定的App,而是一种能完全运行在你自个儿硬件设备上的智能体。它不像ChatGPT那样,你关了窗口它就啥也不记得了。这玩意儿因为有独立的“记忆”模块,能把你的喜好、说过的话,全记在本地的小本本上 -1

比如说,我上个月心血来潮,对着我电脑里的那个代理嘟囔了一句:“明年三月我老妈过六十大寿,提前帮我盯着点有没有好的养生壶打折。”说完我自己都忘了。结果你猜怎么着?前两天它突然通过微信给我弹了个消息:“哥,你上回说的阿姨生日快到了,我搜了一圈,京东有款带语音提醒的养生壶现在比你收藏夹里的便宜八十块,要不要下手?” -1

哎呦喂,那一刻我这心里头,暖得呀!这不就是我梦寐以求的管家吗?它甚至能在我睡觉的时候,自个儿在那儿爬虫、比价、下订单,只要我提前授个权 -1。这对于我们这种懒得天天盯屏幕的“社畜”来说,简直是解放双眼的神器。

被“水土不服”逼出来的国产平替

不过,话说回来,最开始玩这玩意儿可没这么简单。那会儿市面上的开源项目,什么OpenClaw之类的,全是英文文档,配置起来复杂得要死。你得懂什么环境变量、防火墙规则、API密钥,我拿着那教程看了十分钟,脑袋都大了一圈,感觉像是在看天书。这不是欺负我们这些不懂代码的老实人吗?用咱四川话讲,那就是“搞啥子名堂嘛”! -5

这就是典型的“水土不服”。老外做的东西虽好,但没考虑到咱国内普通用户的痛点——我们就想开箱即用,谁有空跟你那儿敲代码?

好在咱们国内的开发者也争气。前段时间我发现出了一个叫“Molili”(莫哩哩)的东西,简直就是救星。这玩意把那个复杂的海外开源项目给“汉化”并且“傻瓜化”了。下载个安装包,双击运行,拿微信扫个码,三分钟不到,我就在公司电脑上部署好了一个属于我的ai...小小-代理-5

这感觉就像啥呢?就像你一直想吃一顿正宗的法国大餐,结果发现得自己从头种地、养牛、烤面包。这时候突然出现一个外卖小哥,把做好的蜗牛和鹅肝端到你面前,还附赠一双筷子。那种“得救了”的心情,真的只有被复杂配置折磨过的人才懂。

有了这个Molili,我现在的生活那叫一个“懒”出新高度。上班摸鱼的时候,用手机让它帮我查家里电脑的资料;下班路上,提前让它打开家里的空气净化器,顺便把今天钉钉里的工作日志总结成周报发我微信上 -5。这哪是AI啊,这简直就是我请的24小时待命、不吃不喝不拿工资的小秘嘛!

说句掏心窝子的话

当然,这玩意儿也不是十全十美。毕竟是在本地跑,你那电脑要是太旧,可能还真带不动。而且虽然安全性比放云端高,但你要是自己把病毒下了,或者授权给了一些乱七八糟的插件,那也够喝一壶的 -1-9。所以咱得心里有数,这就像养了只哈士奇,平时它能帮你拿快递,但你也得把家里的电线藏好,别让它拆家。

但对于我这种受够了那些“没记性”AI的气的用户来说,这种能真正记住我生活琐碎、能主动帮我办事的代理,确实是刚需。它不再是那个冷冰冰的问答机器,而是真有点像个“家庭成员”了。

看完了我这絮絮叨叨的体验,估计大伙儿心里也痒痒的,或者一肚子疑问。没事儿,我在网上经常看那些老哥们在论坛里吵,今儿个我也模仿他们那个味儿,挑几个大家可能最关心的问题,咱们敞开聊聊。


网友“码里行舟”问:
看着确实挺酷,但我就是个纯小白,代码都看不懂,这玩意儿部署起来到底有多难?会不会折腾半天最后还是个残废?

答:
哈哈,“码里行舟”这名字一看就是同行,不过您谦虚了!说实话,你要是在半年前问我,我肯定劝你趁早歇菜。那时候确实不是人玩的,我在虚拟机里配那个网关的时候,差点把键盘吃了,那个命令行报的红错,看得我心里拔凉拔凉的,这他娘的就不是给正常人用的 -5

但现在不一样啦!兄弟,时代变了。我前面不是提了一嘴那个“Molili”嘛,这玩意就是专门来普度众生的。它搞了个安装包,就跟咱们装QQ、装微信一样,双击一下,下一步下一步完事儿。然后它有个特别接地气的操作——绑定微信。

你想想,你妈都会用微信吧?你就用那个劲儿去弄它。装好了之后,你在微信里给它发消息,就跟跟朋友聊天一样。你说“帮我把桌面那个《工作总结》整理一下”,它自己就咔咔去干了。整个过程丝般顺滑,根本不需要你去配置那些什么API密钥,更不用提什么环境变量了 -5。如果你非要较真,唯一算得上“门槛”的,可能就是你需要有一台不关机、一直开着的旧电脑或者Mac mini当“服务器”。但话又说回来,现在谁家没个淘汰下来的旧笔记本?擦擦灰,插上电,它立马就摇身一变成了你的私人管家,这买卖不亏吧?

网友“吃瓜群众张小花”问:
这玩意儿听起来是挺能干的,但我有点害怕。它把我家电脑啥的都控制了,万一它哪天“叛变”了,把我银行卡密码啥的泄漏了咋办?这不比在网页上聊天危险多了?

答:
“张小花”这名字可爱,但提的问题可一点不傻,这恰恰是咱们最该关心的核心!你能想到这一层,说明你是个过日子的人。关于隐私这事儿,咱得掰扯清楚。

我给你吃颗定心丸。恰恰相反,这种本地代理比你在网页上聊天安全得多!你想啊,你跟ChatGPT聊天,你的每一句话其实都上传到人家的服务器了,那些服务器在哪儿你都不知道,你的数据被拿去训练啥了,你更不知道。那就是个“黑箱” -4

但咱这个ai...小小-代理,它是生在你电脑、长在你电脑的。所有的聊天记录、你的口味偏好、你的日程安排,全都是以文件的形式存在你的硬盘里,而不是存在什么云端 -1。这就好比你把私房钱藏在自家床垫底下,和藏在公共广场的垃圾桶后面,哪个安全?

不过,你说“叛变”这事儿,虽然这代理本身不会像电影《终结者》那样觉醒,但确实有个操作风险得注意。因为这家伙太能干了,它能直接操作你的电脑,如果有一天你鬼迷心窍,让它去执行一个从网上下载来的、来路不明的“技能包”,那它可能真的会傻乎乎地把你的文件删了,或者把隐私给发出去了 -1-9。这就像你不能因为家里请了个靠谱的保姆,就把保险柜密码和存折都随便扔桌上吧?咱们得有点“数字卫生”意识,给它划个底线,不该碰的地方别让碰。现在很多新出的代理也都有“沙盒模式”,就是先在一个隔离区里试试水,确认安全了再放出来 -9。所以,放心用,但别“放心大胆”地用,留个心眼儿准没错。

网友“科技宅阿正”问:
我看你这写的大部分都是基于文本的操作,它能处理视频或者图片吗?比如说,我丢给它一个两小时的会议录像,它能帮我总结出谁在摸鱼,谁提出了关键意见吗?

答:
“阿正”这个问题问到点子上了,够专业!一看就是想把AI压榨到极致的主儿。关于多模态,这事儿得分两步走。

目前的“开箱即用”版本,比如我说的Molili,主要还是强在文本处理和逻辑执行上,比如整理文档、操作软件、控制家电 -5。直接丢一个两小时的会议录像让它“看懂”,坦白讲,对它现在的“脑子”来说,负担还是有点重,处理起来可能会卡成PPT,或者干脆跟你说臣妾做不到。

但是!但是啊,咱们不能小看了这个生态的进化速度。你知道现在那些真正的极客在干嘛吗?他们在利用这个框架给代理装各种各样的“技能”,也就是插件。ai...小小-代理这玩意儿最牛的地方就在于它的无限客製化 -1。官方不支持,大佬们自己写脚本加上去。比如说,它可以先调用一个语音转文字的模型,把会议录音转成逐字稿(这个现在很成熟了)。然后它再去分析这几十页的逐字稿,谁提到了“预算”,谁老在问“截止时间”,这不就把关键人和关键点给揪出来了? -7

至于看画面识别谁在摸鱼,那需要更复杂的图像识别能力,技术上能实现,但就像前面说的,得看你的电脑显卡够不够强劲(处理视频巨吃显卡)。所以结论是:完全处理视频,现在有点吃力;但拐个弯处理视频里的声音和文字,已经有人在这么干了,效果还挺香! 咱们就搬个小板凳,看着这帮技术大神继续折腾,估计再过个一年半载,你说的这些就都是基本操作啦。