2

计算机视觉的深度学习实践

领先的秘密在于开始行动。

马克·吐温

最近得空读了不少书,其中Deep Learning for Computer Vision with Python值得推荐。作者Adrian Rosebrock是计算机视觉和机器学习的PhD,维护PyImageSearch.com的同时在社区也是非常积极,在Kick Starter众筹了这本书。

传统的计算机视觉教程往往针对数据科学家(Data Scientist)分享算法,而这本书针对数据工程师(Data Engineer)注重实践,通过数据集和代码,帮助计算机视觉的爱好者快速掌握基本的工(XIU)程(GAI)开(DAI)发(MA)能力。之所以Hello World深得人心,也是同样的道理。

这本书提供了神经网络、卷积神经网络、代码实践、训练和调优、目标识别等内容:

根据内容的难易程度分成了初学者、实践者、ImageNet三种版本:

  1. 初学者版本介绍了机器学习理、神经网络、卷积神经网络等知识、Keras类库使用、以及ResNet等预训练模型的使用方法,并用这些知识完成破解验证码、检测微笑等问题。
  2. 实践者版本提供高级实践经验以及模型训练最佳实践。
  3. ImageNet版本将分享如何分布式训练大规模数据集ImageNet。

百度云智学院也提供了官方培训,计算机视觉方面的课程不仅仅与涵盖了初学者版本以及实践者版本的范围,案例方面也比较有特色,比如文本验证码破解提供了端到端的模型、通过迁移学习完成图形验证码破解等等,此外还有目标识别、人脸识别等课程,心有戚戚焉。

 



张 琪

2 Comments

发表评论

电子邮件地址不会被公开。 必填项已用*标注