跳转至

计算机视觉导读

本文记录计算机视觉的入门笔记。

成绩组成

考勤 5%,作业 10%,实验 10%,大作业 25%,期末 50%。

任务定义

计算机视觉 (Computer Vision, CV) 是一个人工智能研究领域,主要利用「图像、视频」等数据解决「预测、生成」等下游任务。其中:

  • 预测任务比如:图像/视频分类 (Image/Video Classification)、目标检测 (Object Detection)等;
  • 生成任务比如:风格迁移、图像/视频生成等。

数据预处理部分见 数字图像处理

参考内容

理论部分参考:

  • 《Computer Vision: Algorithms and Applications, 2nd Edition》 1
  • 《计算机视觉理论与实践》2

实践部分参考:

  • Computer Vision Course 3
  • 《动手学深度学习》 4
  • PyTorch Vision Docs 5