哎呦喂,最近这AI圈是彻底疯了。
不知道你们发现没有,年前大伙儿还在那儿折腾聊天机器人,你一句我一句问“今天晚上吃啥”。结果一眨眼到了2026年三月,风向全变了!现在的潮人是啥?是让AI直接动手干活——不是动嘴皮子,是真的动你的鼠标键盘,在你的电脑屏幕上噼里啪啦一顿操作,完事儿把PPT或者表格直接甩你脸上。

我这个数码圈的“老小白鼠”自然没忍住。上周脑子一热,直接把最近开源的几个所谓的AI桌面代理工具塞进了我的办公电脑。什么Open Cowork、阶跃的桌面伙伴、还有那个名字挺唬人的天工Skywork,全给安排上了。
用了一周,怎么说呢,那种感觉就像——你雇了一个脑子不太灵光但手脚特别勤快的实习生,有时候气得想骂娘,有时候又爽得想给它磕一个。

一开始我是拒绝的,毕竟这玩意儿靠谱吗?
先给大家交代一下背景。我这人吧,打小在重庆长大,性格比较“泼烦”(就是急躁的意思),最讨厌那种花里胡哨但不顶用的软件。之前那些所谓的AI助手,哪个不是在那儿“你好,我能帮你什么”?结果真要它干活,它就给你甩一堆百度来的过时信息,气得我肝疼。
但这回不一样了。我看重的就是这帮AI桌面代理工具能直接操作我的电脑-1。
安装那天晚上,我就给它下了一个死命令:把我桌面上那堆命名为“新建文件夹(1)”到“新建文件夹(99)”的妖艳贱货给老子整理好。
好家伙,这货是真不含糊。我用的那款基于Open Cowork内核改的工具,接的是Claude的模型。它先是用屏幕截图功能扫了一眼我乱得像狗窝的桌面,然后在对话框里给我列了个清单:识别文件类型、创建分类文件夹、按规则移动-1-8。
那一刻,看着屏幕上那个小光标自己在那儿动——右键、新建文件夹、重命名、拖拽文件——我的后背是发凉的。那种感觉咋形容呢?就像是半夜醒来,发现你家的扫地机器人在那儿自己画图玩。虽然是它在帮你干活,但那种“它竟然真的在碰我东西”的刺激感,懂吧?
它不仅分好了类,还顺手把一堆“截图(1)(1)最终版”这种破名字改成了标准的日期格式。就冲这点,我单方面宣布,它比我家那口子还懂我的痛点。
真正让我破防的,是那天晚上在地铁上
但这玩意儿真正让我觉得“离不开你了”,还得是前天。
那天我在公司加班搞一个竞品分析,搞到晚上九点,老板大手一挥:“回家吧,明天和销售团队同步一下。”结果我刚挤上北京那能把人挤成相片的10号线,手机震了,销售总监在群里艾特我:“亲,刚才说的那几个竞品数据,能不能现在发一下?我们今晚正好开电话会。”
我当时满脑子都是《让子弹飞》里的台词——“这不是欺负老实人吗!”
但巧了,那天我刚在飞书上接入了那个叫OpenClaw的远程协同功能(其实就是配了个机器人)-3-7。抱着死马当活马医的心态,我直接在手机上往那个飞书群里扔了一条消息:“把我电脑桌面上‘竞品分析’文件夹里的最新数据汇总一下,做个PPT,发群里。”
说实话,发完我就后悔了。地铁上信号时有时无,我甚至开始脑补我家电脑突然自己开机,屏幕亮光照亮整个黑漆漆的工位,那画面简直就像科幻恐怖片开头。
结果你们猜怎么着?
大概过了七八分钟,等我出了地铁站,拿起手机一看——那个飞书群里,安安静静躺着一个PPT文件。那个AI桌面代理工具不仅把数据汇总了,还特么自己做了几个图表,虽然配色有点丑(直男审美,原谅它了),但里面的数据一个都没错。
我当时站在地铁口,三月份的北京还有点冷,但我愣是觉得浑身发热。这不就是当年《钢铁侠》里贾维斯的雏形吗? 虽然不是语音控制,虽然还要打字,但这已经是我离未来最近的一次了。
当然,它也干过让我社死的蠢事
别光听我吹,这货也有翻车的时候。
有一次我让它帮我把一份关于“竞品价格调整”的Excel数据,提炼出关键点,然后写一封邮件发给市场部。
这货理解能力确实可以,刷刷刷把数据提炼了,然后打开了我的Outlook,收件人填对了,标题写对了,正文写得也像模像样。但就在我喝口水准备检查的那一刻,我发现它在“附件”那一栏,把Excel原件也贴上去了。这没问题,挺细心。
问题是,它贴的那个Excel原件,文件名是 “竞品价格调整_打死不改版_v3_最终版_绝对不改了.xlsx” 。
这要是发出去,我在市场部那帮小姑娘眼里得是个什么形象?一个连文件命名都这么纠结的抠脚大汉?
吓得我一个激灵,赶紧抢过鼠标把它拦了下来。这让我深刻意识到,现在的AI虽然能干活,但完全没有“社交情商” ,它不懂什么是职场黑话,不懂什么叫体面。你让它干活,它就像个没脑子的肌肉男,力气是有的,但怎么穿衣服见人,还得你这个当老板的把关。
那这玩意儿到底适合谁?
我个人觉得,如果你是一个经常被琐事缠身的“表哥表姐”,或者像我这种又懒又事儿多的伪极客,这类工具绝对是救星。
比如那个阶跃的桌面伙伴,它的“妙计”功能就挺对我胃口-2-5-6。我就设置了一个“处理出差报销”的妙计。每次出差回来,直接把一堆发票照片和行程单扔进文件夹,激活妙计,它自己就屁颠屁颠地去识别金额、填写报销单、计算总和。虽然偶尔会把“地铁票”识别成“滴滴打车”,但改几个字总比自己从头填省事儿多了。
还有那个天工Skywork桌面版,它在Windows上的表现确实挺猛,最让我震惊的是它能直接写Python脚本去处理那些没法批量操作的文件-8。有次我需要从一百多个Word文档里把图片捞出来,以前的笨办法是一个个打开另存为,它倒好,直接写了个脚本,几十秒搞定了。那一刻我真的有点慌,感觉自己那点可怜的Python知识,在这玩意儿面前有点不够看了。
最后说点掏心窝子的
总的来说,现在的AI桌面代理工具就像个刚满18岁的小年轻,力气大、热情高,但眼力见儿差点。它做不了那种需要创意、需要人情世故的高精尖工作,但它绝对是处理那些“脏活累活”的一把好手。
它会把你的工作切碎,把那些最无聊、最重复的碎片吃掉,然后把那些需要动脑子、需要做决策的硬骨头留给你。以前我觉得“数字生命”是科幻片,现在我觉得,让我的电脑替我上会儿班,我在旁边翘着二郎腿喝咖啡,这可能就是属于我们这代打工人的小确幸吧。
网友问答环节:
网友“程序员小王”问:
哥,看你写得挺热闹,我比较关心这玩意儿对程序员到底有啥用?它能帮我写代码不?会不会把我本地的环境变量搞得乱七八糟?毕竟我们这行最怕环境崩了。
答:
哎哟兄弟,你问到点上了。我虽然不是专职程序员,但也折腾代码。这么说吧,让它独立写一个微服务架构那是扯淡,但让它干点“脏活”,它绝对是顶级的。
比如我上周折腾那个贪吃蛇游戏升级,我就直接把代码扔给它,说“帮我用Pygame重构,加个排行榜”-5。它自己就去装包、改代码、调试。虽然中间报错过几次,但它会自动换个方式重试,那感觉就像看一个倔强的实习生在那儿查Stack Overflow。最让我放心的是,现在的工具比如天工Skywork,它执行任务是在一个本地虚拟机(沙箱)里跑的-1-8,动不了你的系统核心环境,这就好比让它在一个透明的玻璃房里干活,你在外面看着,出事儿了大不了把玻璃房拆了,伤不到你的“真身”。所以放心,只要你授权的时候看清楚它要的权限,一般崩不了。
网友“山城棒棒军”问:
你硬是说得悬吊吊的!我这种五十多岁的老会计,电脑都用不太撑头,你说的这个啥子“代理工具”我搞不搞得懂哦?主要是我每个月要做报表,眼睛都看花,这玩意儿能帮我看看数字对不对不?
答:
老乡见老乡,两眼泪汪汪!你放心,现在这帮软件商也学精了,晓得我们普通人搞不懂那些代码命令。现在的工具好多都是直接下个App安装就行,打开就是个悬浮球或者图标在那儿飘起-5-6。
针对你说的做报表,我特意试过。比如你手头有一堆银行发来的那种看不清楚的电子回单截图,换以前你得一个个打开看,眼睛都要瞎。现在你可以直接把这些截图拖进对话框,告诉它:“给我把每张图的金额、日期、对方账户抠出来,做个Excel表。”它就能给你办妥-8。不过我得给你提个醒,数字这东西,它识别偶尔会有错,毕竟它不是神仙。你得把它当个“手脚麻利的学徒”,它给你整理成表格,给你节省了百分之八十的打字时间,但最后那百分之二十的核对工作,还是得咱自己来,毕竟钱的事儿马虎不得,你说对不?
网友“设计美学姐”问:
看完了文章,感觉这工具好可怕,完全没有隐私了。如果我让AI整理我电脑里的设计稿或者私密照片,它会不会偷偷上传到服务器啊?我就是想用又不敢用,很纠结。
答:
姐,你这个担忧太真实了,我第一次用的时候也怕,毕竟现在大数据时代,谁都怕“裸奔”。这一点我专门研究了一下,现在市面上的开源桌面代理工具其实把这个问题考虑得挺细。
很多工具现在主打的就是“本地优先”和“沙箱隔离”-1-7-8。什么意思呢?就是你授权它操作的文件夹,默认就只有那一个。它就像个被关在特定房间里的机器人,你让它整理这个房间,它绝不敢探头去隔壁卧室瞅一眼。
而且,像Manus那种通过浏览器操作的,它直接用的是你本地的浏览器,借用的是你的登录态,也就是说它的行为会被网站认为是“你本人在操作”,数据压根儿没经过它们的云端,直接在你电脑和网站之间点对点传输-9。当然,最保险的办法是,重要的设计稿、身份证照片,用之前单独建个文件夹给它,用完就把授权收回来。 把它当成一个临时工,而不是把家里的保险柜密码告诉它,这样既享受了便利,心里也踏实。