如何评价 12306 的最新版验证码? 王猫猫,前班级文艺委员/现副班长 中午看到这个验证码就囧了。 以前和同学讨论过图片验证码的问题,结论就是不靠谱。 图片过于复杂、混淆过多、条件太诡异时会挡住大部分正常用户 容易被枚举,题库太弱,不如字符组合可能性多 破解门槛不一定高于字符型 Captcha 目测 12306 图片是低分辨率网络图片。猜想用公共服务就足够破解了,不需要自己搞机器学习什么一类。公共服务例如: 百度识图 百度识图——以图搜信息,发现更多可能 Google 图片 http://images.google.com ... 撸代码,试运行,一次通过,放截图: 第一次: 第二次: 挂上 tesseract 识别试试(其实用过都知道官方训练数据准确率不高),来个 Good Case。 结论: 233333 ~ 代码: andelf/fuck12306 · GitHub UPDATE: 有人提到验证问题中文字的识别。所以加入了 tesseract 试了下,Good Case 不多,需要改进。这里只是展示可行性。 查看知乎原文