我在街头看到了这样一个东西,我很好奇这个是什么东西。
你知道这是什么吗?
Image
带着疑问,就我问了分别问了几个AI。
看看他们给我些什么答案。
首先用的是最近热门的DeepSeek,看看它能不能认出来这个东西。
Image
Image
显然,DS识别文字的能力是很强的,但是对于图片上最主要的这棵树和树上面这个毛衣织物,它是视而不见。
接着是豆包,它轻松认出来了这个东西:
Image
豆包的表现很不错,它知道这是给树编制的毛衣。它还识别出了卡通图案有眼睛有围巾,并且指出给树织毛衣的意义:
可爱有趣美观,还能给树保暖。
接着它能识别出树后面的文字、店铺招牌,还有建筑物外墙。看来,它的“视力”比较好。
ChatGPT能不能认出来这棵穿毛衣的树呢?
Image
gpt像豆包一样,已经认出来图片中的树和毛衣了,并且介绍这个东西叫作“树木毛衣”或“城市编织艺术”。它也识别出了毛衣的卡通形象和围巾。
继续问它树的后面背景,看看它能认出来什么?
Image
不仅能认出来商铺、文字招牌,gpt还发现了旁边有铁栏杆、自行车/电动车。
继续问,看看它还能有什么发现呢。
Image
不是听它说,我还没发现,竟然还有那么多细节啊。上面这个玻璃窗反光它也都看到了。
不过,风扇在哪里呢?我找一下,好像没有风扇呀。
原来它看错了,下面这个虽然很像风扇,可是,肉眼可见的:不是风扇啊。
Image
总结一下。我目前用到的deepseek版本,识别图片中的文字是没有问题的。但是,图片以外的内容它都没有给我回答。这一点,还是远不如豆包和chatgpt,它俩真的识别出图片中更多的图案细节。
chatgpt比豆包看到和分析地更加详细,不过,看到太多细节的情况下,也会有看走眼的时候。
期待AI软件识别图片的能力更强,以后能有更多的功能和玩法吧。