发布日期:2026-06-19 19:15 点击次数:74


机器之机杼剪部
比闹钟还准。
端午节前,DeepSeek 竟然如斯又有了新算作:官方平台全量推送了识图风景,手机端 App 也发布了更新,开放就能看到。

此前,依然有不少网友体验过这个功能,但其时它还处在小畛域的灰度测试阶段,只好部分用户能够在官方 App 或网页版里看到。然则今寰宇午,好多东说念主皆暗示我方也能用了。
出于艳羡,咱们也开放 App 测试了一下。
第一个测试案例用了黄仁勋前段时间在北京小吃街喝豆汁的图片。可以看到,DeepSeek 能够认出图中东说念主物是黄仁勋,但瓶身上的「豆汁」字样被忽略了,因此错把豆汁认成了牛奶。此外,它关于东说念主物神气的解读也不够精确。


接下来,咱们切换了深度想考风景,稀薄义的方位来了:诚然 DeepSeek 依然「看不清」瓶身上的「尹三豆汁」字样,但凭借推明智力和寰球学问,他料到出了这是「豆汁」。不外,神气解读方面,深度想考也莫得太大匡助。


在外交媒体上,也有不少网友进行了东说念主物方面的测试,但后果似乎不太想象,像何同学等驰名东说念主物皆出现了识别乌有的酣畅。

就连梁文锋本东说念主,DeepSeek 也莫得认出来。从想考流程来看,它识别东说念主物的时候主要依靠视觉踪迹(面部特征、发型)与东说念主物公众形象进行对比,斗鱼体育DOUYU中国官网因此准确率不高也很畴前,毕竟像黄仁勋那种特征如斯独有的东说念主物属于少数。

此外,它的安全适度相比严格 —— 咱们试图上传一张雷军近日的热点图,却被奉告「可能违犯使用法度」。

接下来,咱们又让它辩认失魂鱼字。图片中的烂字有横线侵扰、笔画粘连、还有错别字侵扰。

DeepSeek 7 个字识别错了 4 个。
21点棋牌app2026中国最新版官网这阐扬,该模子在真的场景手写文本识别、限度词汇敛迹和语义纠错方面仍然有普及空间。

识别文物的智力倒是荒谬可以。诚然 DeepSeek 没能告捷找到这件文物的出处,但告捷地判断其是莫卧儿帝国立场,并详备分析了其工艺。

关于一些较难的图,比如找出下图中透顶疏通的袜子,DeepSeek 也没找对。(正确谜底是第一转第三个和第三行第二个)

在钢琴和弦识别测试中,上传了一张钢琴弹奏实拍图,发问「弹的是什么和弦」。
钢琴黑键按「两黑 + 三黑」组规章陈列,两黑键中间的白键恒久是 D 音,从 D 开拔即可料到出相邻的 C 和 E 等音高,因此正确谜底应是 ACE。
DeepSeek 判断乌有。

教导词来自X博主@thinkingshivers
咱们同期测了 Gemini 3.5 flash、GPT 5.5 和 Claude Sonnet 4.6,前两者没一个答对的,Claude Sonnet 4.6径直歇工。这也阐扬这些大模辅音在乐理方面的推明智力的局限。

Gemini 3.5 flash回话乌有。

GPT 5.5回话乌有。

Claude Sonnet 4.6歇工。
由于时间有限,咱们的测试无法熟悉肃肃,环球可以切身尝试一下。
跟着这个风景的全量发布,诞生者们也有了新的疑问,比如它和 DeepSeek 4.1 有没联系联?背后时刻是不是用的原生多模态?多模态的 API 又什么时候能上线?



这些问题出咫尺 DeepSeek 多模态团队商议者 Xiaokang Chen 的 X 贴文指摘区。不外,他并莫得就这些问题给出谜底。
省略过几天斗鱼体育DOUYU中国官网,DeepSeek 会发布联系的时刻文档,咱们静瞻念其变。