%3Cbr%3E%3Cbr%3Emicomia株式会社の畑井です。今回は自ら学習して賢くなってくれる学習型AIと呼ばれるAIについて紹介していきます。%3Cbr%3E%3Cbr%3E%3Cbr%3E%3Cbr%3E1.自ら学習してくれるAIの仕組みとは?AIが自ら学んで賢くなっていくこの仕組みに大きく寄与しているのは強化学習という考え方です。AIが何かをしてその結果成功や失敗をします。成功したときには報酬を得られるように設計されており、報酬を得られるようにAIが動くため結果的に成功パターンをAIが繰り返せるようになります。ChatGPTも強化学習の考え方を取り入れています。開発段階では、人がAIの返答に「良い/悪い」を評価し、その結果をもとに報酬モデルを作り、AIがより良い返答を出すように訓練されました(RLHFと呼ばれる手法です)。%3Cbr%3E%3Cbr%3E2.学習型AIが使える場面とは?2-1.囲碁や将棋囲碁や将棋など特定のルールのもとでベストを出すものは学習型AIが強みを出せる分野です。勝敗結果をもとにどの手がベストかどうかを自律的に学ぶことができるので対局回数が増えれば増えるほど強くなります。%3Cbr%3E%3Cbr%3E2-2.自動運転車線の維持や目的地への到達で報酬が得られるように設計することで目的地に安全に移動できるように学習させることができます。%3Cbr%3E%3Cbr%3E2-3.金融取引利益が出た取引では報酬を得ることで取引の予測精度を高めています。金融取引の場合、環境の不確実性が高いため必ず儲けることは基本的にはできませんのでご注意ください。%3Cbr%3E%3Cbr%3E3.まとめ自ら学習してくれる学習型AIしかいらなくないかと思われがちですが、答えが明らかでそこまで計算に時間とコストをかけられない場合は教師あり学習と呼ばれる答えを教えてその通りに判断できるAIを開発した方がかなり経済的です。学習型AIは動かしてすぐですとかなり精度が悪いことが多いので、気長に学習が進むまで待つ必要があります。%3Cbr%3E%3Cbr%3E