这几天iOS微信聊天页面里多出个小东西,长按任意一张图片或文件,即可看到全新的“总结”功能按钮,点进来不跳浏览器,微信里直接弹个悬浮窗,后面是混元大模型在跑,对着这张图就能问话,它先看懂再回答,操作轻,几乎感觉不到停顿,像在当前聊天里接一句话那种顺畅感。
它做的不是以前那种只扒字的OCR,这次是真的能看懂图片,群里同事甩一张复杂的业务架构图,线一堆块一堆,之前要眯着眼一块块看,实在看不明白再打字问这图啥意思,现在长按点AI,让它先把结构捋清楚,数据流向怎么走,核心模块在哪,几秒给你一版总结,细节你接着追问也能接得住,处理满是专业术语的图表时省力不少.
常见的图它基本都能接住,截图这类像聊天记录截图网页截图,直接把字提出来,还会把重点归纳给你,文档表格这类像拍屏的Excel和PDF页面,能识别表头表格结构,能看出列名行名,对着数字说趋势,像同比环比这种变化给出方向,二维码条形码放进来,它会先告诉你这是个什么码,是支付码还是网页链接之类,陌生链接不轻易点开,先知道类型再处理,心里更稳当.
好用点在不跳转,过去想让它总结文档要去元宝App,这次全在聊天窗口里走完,长按进菜单点AI,悬浮窗弹出来就能对话,问几句看完收起,整段聊天不中断,你回群消息的节奏不被打散,上班时这种流里用工具的感觉很顺,群里老板甩一张密密麻麻的数据截图,让大家看看,手指一按让AI把核心变化抓出来,数字涨跌在哪先标给你,反馈更快.
有两个点需要提前想清楚,隐私这根线要绷住,官方在数据安全上有承诺,但图片要传到云端识别这个流程存在,涉及身份证银行卡隐私合同这类高度敏感内容,不建议丢在线上处理,提前打码或在本地工具里做更合适,这事放到任一云服务都一样。另外这个功能还在灰度测试阶段,现在不是每个人都能看到这个按钮,长按没有就说明还“宠幸”到你的账号,等版本迭代慢慢放开,这也是微信推新功能的一贯节奏.
没拿到新功能的人也有个小技巧,在微信上方的搜索框里搜腾讯混元或图片AI,找到对应的小程序或服务号,把图片直接发过去,对话里就能识图问答,效果基本一致,还能聊更长几轮,整个过程也不需要再跳App,一举两得,这个技巧知道的人还不多。
把这些合在一起看,这个新按钮把图片理解这个能力变成了一个长按就能用的动作,复杂的处理都藏在后台,前面只剩一个简单入口,隐私和灰度这些注意点摆在那不难把握,但对于日常处理图片信息来说,确实是个能节省大量时间的“神器”,它预示着未来与AI的交互将无处不在。