k.style

Kaggle に挑む深層学習プログラミングの極意

最終更新日: 2024 年 09 月 04 日

極意を習得するまでにはまったく至っていないが、色々と学びはあった。初版は『Kaggle で勝つデータ分析の技術』が 2019 年で、こちらが 2023 年である。ここには 3 年ほどの開きがあるが、その間にも様々な変化があったことがよく理解できる。わかりやすいのがデータセットの種類である。 2016 年ごろまではテーブルが主流だったのが、段々と画像やテキストを題材にしたものが増えてきて、 2021 年にはその割合が完全に入れ替わっている。もちろん Kaggle のトレンドではあるのだが、社会から要求されるものもそうなってきていると理解していいだろう。

個人的に最も興味深かったのはやはり BERT (Bidirectional Encoder Representations from Transformers) である。 2019 年以降、 NLP (Natural Language Processing) 系のコンペティションでは Transformers を用いたモデルが中心となり、 RNN (Recurrent Neural Network) や特徴量エンジニアリングは特別な理由がなければ使用されなくなっているらしい。ものすごい勢いで新しい技術が生まれるので、これに追いつくことすらもできていないように感じている。一方で社会への応用はかなりイメージがしやすくなった。せめてこの変化を楽しめるようにはなりたいものだなと思う。