本インタビューでは、バンダイナムコネクサス平木様に、お薦め書籍、キャリア、情報収集方法、現在のお仕事、職場などについてお伺いしました。
平木さんについて
バンダイナムコネクサス所属のデータサイエンティスト。データサイエンティストチームに所属し、現在は各種ゲームタイトルのレビュー分析に従事。大学の数学科、エンジニアという経験を経て「何年も何十年も先に残っていくようなものを作りたい、関わりたい」という想いを持ち、データサイエンティストに転職。
平木さんインタビュー
お薦め書籍「[第3版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践」について
ー 今回紹介する書籍のタイトルと、その内容について教えてください。
平木:はい、今回紹介させて頂くのは、「[第3版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践」という本で、分厚くて辞書的な内容の、一般にお薦めしやすい機械学習の専門書です。分類から回帰まで、応用としてアプリケーション開発や感情分析、モデルのチューニングなど、機械学習の技術面で使われる大部分をカバーしています。
書籍概要
『Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow 2, 3rd Edition』の翻訳書。機械学習コンセプト全般を網羅し、理論的背景とPythonコーディングの実際を解説する。初歩的な線形回帰から、ディープラーニング、敵対的生成ネットワーク、強化学習等を取り上げ、scikit-learnやTensorFlowなどPythonライブラリの新版を使ってプログラミング。第3版は13~16章の内容を刷新し、敵対的生成ネットワークと強化学習の章を新たに追加している。
[第3版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践の購入はこちらから
ー 第3版まで出版されているというのは、かなり安心感がありますね。
平木:現在は第3版まで出版されており、知識が古くならないように内容の更新が行われています。機械学習のコアとなる知識が網羅的に盛り込まれており、そういった面で信頼がおける書籍となっているため、広くおすすめできる一冊だと思います。
ー この書籍のお薦めポイントを教えていただけますか?
平木:お薦めポイントとしては、今後数年も使えることが期待できる点です。第3版が出版されたことからも、本書で扱われている技術が、繰り返し使われてきた技術であることが分かります。さらに、この本は原著の紹介や歴史も書いてあるので、読みやすくストーリー感があり、読みやすい内容となっています。
ー 分厚い辞書的な本なのに読みやすいのですね。実際に仕事ではどのように使っていますか?
平木:新しい業務をやるときに、例えば分類問題やディープラーニングの基礎理論を振り返るときに使います。業務の中では、チームで以前開発したものからのコピペ中心でコードを書くことも多いのですが、背景にある理論をきちんと理解していないと、実行結果やコードの内容が理解できず、行き詰まってしまうことがあります。そのため、書籍を通じて、理論的な理解を深めることが大切だと思います。
ー 確かに、精度改善がうまくいかないときには、理論的な理解が必要になるシチュエーションは多いですよね。そういったときに、教科書的な本が一つあると便利ですよね。
平木:そうなんですよ。理論の復習にこの本をよく使っています。この本に限らず、困ったときに立ち戻れる、理論的な背景の理解を深めてくれる教科書的な書籍は、個人個人が持っておくべきだと思います。例えば、有名なものでは「PRML」や「統計赤本」など、教科書的なものがあると、困ったときに立ち戻れるので分析の幅が広がると思います。
ー 実際、この書籍が何か具体的に役立ったストーリーや事例があれば教えてください。
平木:例えばレビュー分析を行っている際に、この書籍を参考にしました。Word2Vecなどを使って分析をしていたのですが、いきなり自分が知らない技術を使うと、「なんだこれ」ってなってしまいます。そこで、いきなりWord2Vecを使って分析を始めるのではなく、自然言語解析領域やディープラーニングなどの分野で、過去にどういうことが行われていたのか、そういった部分を勉強することで、最新の分野でどのような改良が行われているのかを理解できるようになります。例えば、ディープラーニングを使った次元圧縮のアルゴリズムが書籍に掲載されていると、「Word2Vecも同じようにディープラーニングを活用した次元圧縮を行っているんだな」というイメージがつきます。
ー なるほど、ありがとうございます。この書籍をどんな人にお勧めしたいですか?
平木:目次を見て、「これが役立ちそうだ」と思うテーマがあれば、1冊買ってみて損はないと思います。この本は688ページと分厚いですが、その分各章がしっかりと説明されています。それぞれのトピックの専門書レベルまでいかないかもしれませんが、詳細な解説が記載されています。また、画像処理や感情分析など幅広いテーマが扱われているので、これから新しいテーマに取り組むような方にとっても、新しい分野の入り口として役に立つと思います。
キャリアについて
ー ありがとうございます。続いて、キャリアに関する質問について深掘りしていければと思いますが、今までの経歴について改めて教えていただくことは可能でしょうか?
平木:前職はエンジニアをしていました。データサイエンティストではなく、エンジニアとして業務に携わっていました。エンジニア業務の中で、一部、Rを使った予測などのデータサイエンス的な部分にも関わっていました。
ー エンジニアからデータサイエンティストにキャリアチェンジされたんですね。データサイエンティストに変わる際に、困ったことはありましたか?
平木:困ったことの方が多かったと思います(笑)今でも苦労はしますし、困らないことはないと感じています。エンジニアからデータサイエンティストに転職すると、数学の理論的な部分で苦戦するイメージがありますが、私は数学科卒なので、数学については抵抗はありませんでした。ただ、学生の頃にやっていた数学は広くはないので、統計やベイズなどは日々勉強しています。また、数学科だと綺麗な数学をやることが多いので、シミュレーションのような力技に慣れ親しんでいないという苦労もありました。
ー エンジニアからデータサイエンティストに転職し、バンダイナムコネクサスに入られた経緯を教えていただくことは可能でしょうか?
平木:転職した時期が2020年で、コロナ禍の真っただ中でした。将来に不安はあまりなかったのですが、ふと、「もしかしたら、自分も死ぬかもしれない」ということを考えることがありました。そんな時に、人生で何をやりたいかを自問自答したところ、「自分が死んだ後も残るようなサービスやプロダクトに関わりたい」という考えが浮かんできました。そのため、「何年も何十年も先に残っていくようなものを作りたい、関わりたい」という想いを軸に転職活動をはじめました。そんなときに、バンダイナムコネクサスの「IPをデータで盛り上げていく」という求人を見つけ、応募しました。コロナ禍でキャリア設計や人生を考えるきっかけがあったのが、転職のきっかけだったと思います。
ー なるほど、IPやキャラクターなどであれば、何年、何十年先も残るため、それに関わる仕事に携わりたいという気持ちで転職されたんですね。
平木:そうですね。例えば、ガンダムという作品は、形は変わるかもしれないけれどこの先何十年も残り続けると思います。そういった作品に対して自分が貢献できればという想いがあります。自分が関わった作品やキャラクターが今後も残り、関わったところが引き継がれる、そこに魅力を感じます。
ー 技術者的な目線での軸は何かありますか?例えば、データサイエンティストとして最先端のモデルが使える、またはクラウドを使った大規模データ処理ができるなどは意識しなかったのでしょうか?
平木:世界的に受け入れられている作品であれば、自然とデータ量も多くなってくるはずなので、データの量や質にも意識を向けていました。国内だけでなく、世界のマーケットにも目を向けることができれば、調査や分析についてもやりがいがある仕事になるだろうなと感じていました。そのため、海外利益があることや、海外ユーザーのデータがあることなども優先していました。最先端技術には常に気を配っていましたが、一番の優先ではありませんでした。
ー それでは、どのようなバランスで事業内容と使用技術のバランスを考えていたのでしょうか?
平木:事業やビジネスモデルの優先度が高く、最低限ある程度モダンな技術を使っていることがサブの条件でした。実務をやる上で最先端に触れたいという思いもありますし、それが求められる現場であることは重要ですが、「何のために使うか」という部分の方が、個人的には優先度が高かったです。
情報収集方法について
ー 続いて、情報収集の方法についてお伺いしたいのですが、普段どのように最新の情報をキャッチアップしていますか?
平木:私の場合はなるべく一次情報に当たるように心掛けています。具体的には、論文やGitHubのコードなどを参照しています。論文は読むのが大変ですが、薄めたような記事を読むのであれば、時間がかかっても論文を読んだ方が良いと思います。
ー 論文を直接読むことが多いのですね。要約された情報を利用することもあるのですか?
平木:もちろん、全く見ないわけではありません。時間の関係上、一次情報に当たらない時もありますし、そういう時は要約したもので済ませることもあります。
ー 論文などの一次情報と、HowTo記事などの二次情報を使い分けるポイントなどは何かありますか?
平木:明確な基準はないのですが、例えばコードを修正する時は、より詳しい技術者の方に聞いたり、記事のコードを参照して済ませることが多いです。一方で、初めてプロジェクトにアサインされるなど、何もわからないときは、根本的な部分を押さえないと進められないので、原著論文や一次情報に当たるように心掛けています。使い分けとしては、理論の設計段階では原著論文を読むが、実装フェーズや動かす段階になると、早く実装できるような方を選んでいます。
現在の仕事について
ー 続いて、平木さんの今の仕事について教えていただけますか?
平木:今は、人気タイトルのレビューを中心に分析しています。ゲームストアのレビューも参考にしています。どのような言葉が顧客の満足度、ゲームの購入数やダウンロード数に影響を与えているのか、自然言語処理を用いて分析をしています。どのようなレビューがどのようなスコアに関連しているか調べることで、最終的にはゲーム品質の向上に貢献しています。
ー レビューの内容をどのようにビジネスに反映させているのでしょうか?
平木:直接的な売上貢献を行っているという訳ではなく、間接的な影響を与えることが多いです。例えば、低いレビューをつけたユーザーが何に不満を持っているのかを抽出し、それに基づいて改善案を考えるような活用をしています。レビューの高い人の満足度をさらに上げるというだけでなく、レビューが低い人の満足度を普通に持っていくことにも焦点を当てています。また、バグやダウンロード時間、UIやUXに関する問題などを抽出することにも活用できます。
ー 確かに、サービスの改善につながるレビューなどは多そうですね。将来的にはどのような使い方が考えられるでしょうか?
平木:将来的には、複数のタイトルやゲーム横断的な分析も行いたいと考えています。同じIPであれば、どのようなゲームが支持されるのか、支持されないのかといった分類もできるかもしれません。例えば、ストーリー進行型のゲームがいいのか、バトルがいいのか、PVEかPVPかなど、細かい違いをレビューから把握し、ユーザーの潜在的なニーズを理解することができると考えています。
ー 確かに、複数のゲームや新しいタイトルにも応用できそうですね。開発の段階でも、重要なポイントを抽出できるかもしれませんね。
平木:そうですね。複数のゲームや新しいタイトルに対しても、分析結果を活用することで、開発段階での設計や改善点を見つけることができます。このようなアプローチによって、より多くのユーザーに受け入れられるゲームを作ることができると期待しています。
ー 分析を行っている中で、特に面白みを感じるポイントはありますか?
平木:面白みというか、個人的には好奇心が大半で、自分が好奇心を持てるかどうかがほぼ全てです。好奇心といってもいろいろで、例えば、最新の技術が使えることや、ビジネスに適応したことがないような手法を取り入れてみること、シンプルに分析結果が面白いことなどの要素があると好奇心をそそられます。「一度もやったことがないこと」という部分がキーポイントだと感じています。
職場について
ー ここからは会社の職場について教えて下さい。平木さんの他には、どのような方が働いているのでしょうか?
平木:コロナ禍でフルテレワーク状況下で転職したこともあり、社内でもより近い範囲とのコミュニケーションが多いので、データサイエンスチームに限ったお話をさせてください。チーム内では、各メンバーのバックグラウンドが結構異なります。私は数学ですが、物理だったり、天文学や情報系など、それぞれ違っています。みんなバックボーンを武器にしている人たちで、とても尊敬できる仲間たちと働けていると感じています。
ー それぞれのバックボーンが生きていると実感するタイミングは、どのようなタイミングですか?
平木:データサイエンティストチームのチーム内で勉強会を開催しているのですが、そこで日々、いろんな人がいろんなテーマで勉強しあったり、知見を共有しあったりしているときに、みんなすごく専門的なことをやっていると感じます。また、分からないことに対して、自分では思いつかないような答えが返ってくるときにも、バックボーンの多様性を感じます。
ー データサイエンスでは、物理の考え方や生存時間分析のような医療系の話など、いろんな領域の数理モデルをビジネスに適応するシチュエーションがあると思いますが、そこでの発想を取り入れてみるということがあるのでしょうか?
平木:確かに、議論をしている際に、それぞれの方のバックボーンとなっている業界では常識だけど、データサイエンスでは使われていないようなアイデアがいろいろ出てくることがあります。それは視野を増やす意味でかなり有効に働いているかもしれません。
ー 多様なバックボーンが業務の中で活かされているんですね。データサイエンスチームに向いている方はどのような方だと感じますか?
平木:共通していることは、自分の専門や業務に対してのインプットや専門知識の勉強を欠かさない人が多いことです。最新技術を常にキャッチアップしていることも重要です。また、これはデータサイエンティスト全体について言えることだと思うのですが、業界のセレクトが大事だと思います。当社の場合はエンタメ業界なので、エンタメに興味があることが大切だと思います。
ー 確かに、データサイエンスの場合はドメイン知識も重要になりますもんね。どのような興味属性を持っている人が、エンタメ業界の相性が良さそうだと感じますか?
平木:例えば、ジャンルを問わず「遊ぶことが好き」ということが重要だと思います。私自身は他の超ゲーム好きなメンバーと比べてしまうとゲームが大好きというほどではありませんが、色んなエンタメに触れる機会があって、それらを面白そうだと感じています。また、自分の担当するゲームをしっかりプレイして理解するような行動もしています。そのため、いろんな種類のエンタメに興味があり、実際にゲームを担当になったら楽しんでやれるような方が向いているのではないかと思います。
ー 最後に、データ人材の方々に向けて、何かメッセージを一言お願いできますか?
平木:データサイエンティストの仕事は地味で、泥臭い作業が多いですし、データと向き合っている人はすごいと思います。データマイニングのような地味な作業も、最終的に洗練されたモデルを作ることでビジネスへのインパクトは大きくなります。ビジネスインパクトの大きいモデルを作ることで、データサイエンティストの方は初めて報われると思うので、そんなモデルを作って報われて欲しいです。皆さん、一緒にデータ分析業界を盛り上げていきましょう!
バンダイナムコネクサス様 採用情報
今回インタビューに答えていただいた平木様が所属するバンダイナムコネクサスでは、キャリア採用を積極的に募集しています。
バンダイナムコネクサス様でのお仕事に興味がある方は、以下のリンクをご参照ください。
現在募集しているキャリア採用のポジション