深層学習、またはディープラーニングとは、人間の神経細胞の仕組みを再現したニューラルネットワークを用いた機械学習の手法の1つであり、多層構造のニューラルネットワークを用いることが特徴です。現在では画像認識や音声認識、翻訳などさまざまな分野で大きな成果を生み出しています。
深層学習の仕組みを使って画像認識や音声認識などを行うには、まずラベル付けされたデータ(教師データ)を用いて学習させる必要があります。たとえば手書きの数字をAIによって認識させたいといった場合、手書きした数字の画像と、その画像に書かれた正しい数字を示したラベルをセットにした教師データを用意し、多層構造のニューラルネットワークに入力します。この教師データを使って自動的に学習を行い、手書き数字を認識できるようになるという仕組みです。
ただ認識精度を高めるためには膨大な量の学習データが必要であり、従来はそれを用意することが困難でした。しかし現在はインターネットの普及などによって膨大なデータを用意することが可能になっています。また学習には膨大な計算を行う必要がありますが、これもコンピューターの進化によって短時間で学習できる環境を整えられるようになりました。このように環境が整備されたことも、深層学習が進化した大きな要因です。