AI图像识别技术的应用探索

总结一下就是以前我用AI,都是截图给他,他识别,我意识到可以连续给他图片,或者直接给他看视频,让他识别到某个东西后发出信号。继续下一步操作。

2026年4月4日 这天我写了一个脚本,来收集一些数据,普通的代码很难通过浏览器,来执行操作,因为浏览器是为人设计的,如果单纯靠脚本通过识别html,js很难走通,可能是有的网页有懒加载或者缓存机制。

于是我尝试了使用了另外一种方法就是截图,让Ai来读图的方式。把这个脚本跑通了。我这个帖子是因为我实验了一下。于是我就联想到他的实际应用,因为之前看过一个讲AI的博主介绍过西门子这方法的事情,他们借助Ai,来识别图片判断产品的不良率什么的,来微调生产线好像是。

然后我就搜索了招聘网站显示有此类招聘但不是很多。我预计知道的人可能还很少。而且b站上边AI图像识别类的视频非常少。我预计这个应用才刚开始。设想是这样的,这等于可以给open claw 这里的智能体框架装上摄像头。装上真正的眼睛。

至于应用层面我现在只是做到了一下基础的识别,判断按钮的位置。然后点击它。不过我觉得肯定会有人来搞出一些新的应用场景。

image.png



最多播放里面没有,


但是我发现了几个有意思的事情,一个是算法的识别,本质上py有这样的库,但是我没有用过,见其他Ai主来用过。

这里面的哈马斯无人机估计是真的。他同时包含了两个关键字。

图片只为参考,结论在第一行。


image.png

发表评论