大変好評いただきました「今年のベストAIニュース」のPart 2となります。

Part 1と同様に今年一年間の振り返りとして、各メンバーが注目した、今年のニュースを発表したいと思います。

Blog 執筆者が選ぶAIニュース

シバタアキラ

自己紹介:DataRobotデータサイエンスチームリーダー。DataRobot歴4年。趣味はアイスクライミング。個人ブログ:https://ashibata.com

初のトランジスタ数1兆のチップを製造するためにCerebrasが克服した5つの技術的課題

大量のデータとディープラーニングを使いより高い精度の予測モデルを生成するには大量の計算リソースが必要となります。GPUやTPUを使った機械学習のハードウェアアクセラレーションはここ数年人工知能技術のフロンティアを押し広げてきました。一般的なシリコンチップはウェハーと言われる大きなシリコン基板上に数百エッチングされ、一つ一つの小さなチップに分割されますが、シリコンバレーのスタートアップであるCerebrasは、ウェハー全体を一つの巨大なチップとして製造するという大胆な発想にたどり着きました。

半導体の製造はその難しさから歩留まりが低いことで知られており、一つのウェハーから作られた多数のチップの中には不良品が複数含まれることが避けられません。つまり、Cerebrasの製造するウェハーサイズのチップにおいては、ウェハー全体の製造品質を著しく向上しなければ、正常な製品の出荷にこぎつけることができません。同社は今年その技術的挑戦を乗り越えプロトタイプの製造に成功しました。同時にこの様なチップ上でプログラムを開発し、動作させるには、独自のコンパイラーなどのソフトウェア基盤が必要になり、同社はその開発も行っています。

この様な巨大な計算リソースを使わなければ解決できない課題はなんなのか?同社で働く知人に聞いたところ、遺伝子医療の事例が上がりました。個人のDNAの特徴により、特定のがんの発がん確率に関してはかなりの精度でのリスク予測ができるケースがありますが、膨大なDNA配列の中から、発病に関連する遺伝子を発見する研究はまだ黎明期にあるといえます。多数の人間のDNAを特徴量に、特定の疾患の発症をターゲットにした機械学習は今まで計算リソースの制約からその発展には大きなチャレンジがありましたが、異次元の計算能力を持ったCerebrasのチップにはその課題解決に期待が持たれています。

オガワミキオ

DataRobot金融担当データサイエンティスト。DataRobot歴3年。趣味はサウナ・キャンプ(クライミングは引退)。

UBER自動運転が横断歩道上の人しか認識できず

「米ウーバー・テクノロジーズの自動運転車が昨年の試験運転中に歩行者をはねて死亡させた問題で、この車両には交通規則を無視して道路を横断する人を認識して反応するプログラムが組まれていなかったことが分かった。米運輸安全委員会(NTSB)が5日に公表した文書で明らかになった。」

AIがブラックボックスでは使えないというのは共通認識ですが、仮にどのように判断しているかということがわかってもその判定ロジックにリスクがないかを見逃しては問題になってしまいます。このケースでは、実験場では普通だった「横断歩道を渡る人」というのを「人」として高い精度で認識していましたが、道路交通法違反をしている人、すなわち「横断歩道外から無理やり渡っている人」は認識しづらいAIになっていました。AIの非ブラックボックス化、説明できるAIは昨今のトレンドとして研究も進んできていますが、その説明を元に正しく人が解釈して、リスクを判断することが重要になっています。

今後のデータサイエンティストの役割はどう変わるのかという質問を多く受けますが、まさにこのようなモデルの真なる性質をしっかりと把握して、手元のデータの中だけでなく、実世界の事象も想像しながら判断していくことも重要な役割となっています。モデルの精度以外の質についてもしっかりと見ていくことがいかに重要か改めて気づかされるニュースでした。

中野高文

自己紹介:DataRobot小売担当データサイエンティスト。DataRobot歴2年。趣味は旅行。

米グーグル、「量子超越性」達成と発表 スパコン超える

Quantum Supremacy Using a Programmable Superconducting Processor

2019年もGoogleはビックリな結果を残してくれました。GoogleのSycamoreと呼ばれる量子コンピューターが最速のスーパーコンピューターでも1万年かかる問題をたった200秒で行える事を実験で実証しました。これは量子超越性(古典コンピューターが解けない問題を量子コンピューターが解ける)が実験で実証された初めての事例です。

量子コンピューティングを活用した、AIの研究も進んでいます。量子コンピューターを使う事でSVMやPCAなどの計算が飛躍的にスピードアップする事が明らかになり、量子ニューラルネットワークに対する研究も活発になっています。

ただ量子コンピューターを活用したAIが現れるのはもう少し時間がかかりそうです。今回の実験は量子状態のシミュレーションを古典コンピューターにやらせると言う少し特殊な状況での優位性を証明しただけです。AIなどの一般的なタスクを実行できる量子コンピューターは非常に大規模になる必要があり、それだけのスケールアップをするにはエンジニアリングの進歩を待つ事になりそうです。

山本祐也

自己紹介:DataRobot製造担当データサイエンティスト。DataRobot歴2年。趣味はKaggle, Kaggle Profile: https://www.kaggle.com/nejumi

グーグルAI道場「カグル」の正体 世界に通じるAI人材(上)

AI人材「カグラー」大活躍 DeNA・PFN・日立 世界に通じるAI人材(下)

2019年は日本のKaggleコミュニティにとって非常に大きな飛躍になった年だったと感じています。国内でも多くの企業でKaggler達の実務における活躍が大きな話題になっていますし、slack channel kaggler-jaには12月時点で7500人が集まっており、日本人Master+Grandmasterも12月の時点でついに100人を突破したとの推計も出ています。これは世界全体での昇格率を大きくoutperformしており、国内Kaggleコミュニティの力強さを表していると言えるでしょう。さらには10月には圧倒的名著「Kaggleで勝つデータ分析の技術」が発売され、12月に日本初のKaggle公式イベントKaggle Days Tokyoも開催されるなどKaggleの盛り上がりはどこまでもとどまることがありません。2020年には一体どうなってしまうのか?目が離せませんね!それでは皆さん、年末年始もHappy modeling!

坂本康昭

自己紹介:DataRobot保険担当データサイエンティスト。DataRobot歴2年。趣味は親子レク。

How to Build Artificial Intelligence We Can Trust by Gary Marcus and Ernest Davis

2019年もAI技術が発展しましたね。採用の自動化、画像認識の自動化などニュースになりました。自動運転も話題になりましたが、みなさんは自動運転、安心して任せられますか?わたしはまだこわいです。Deep Learningなど今の機械学習はたくさんの教師データから学習して精度の高い予測ができるようになりますが、まだヒトのようにOne Shot Learningや、いくつかの例から素早く学ぶことができません。ヒトは常識やドメイン知識といったPrior Knowledgeを使用して、この問題は過去経験したあの問題と同じように解ける、と気付くことができ、よってOne Shotで学習することが可能です。この記事では、AIがPrior Knowledgeをもとにヒトのように判断できるようになるまでは、AIだけによる自動判断は安心して任せられないよね、という内容です。日本語バージョンが見つからず、英語でごめんなさい。実はこのトピックはわたしが認知科学を勉強していた頃のテーマで、著者の一人も認知科学者です。AIで、ヒトだけではできないことができる世界になりましたが、2020年も引き続きわたしたちヒトがきちんと考えてAIを使っていきましょう。

伊地知晋平

自己紹介:DataRobotヘルスケア分野担当データサイエンティスト。DataRobot歴1.5年。趣味はサックス演奏。

深層学習を活用した脳MRI分野のプログラム医療機器として国内初の薬事承認を取得し、医用画像解析ソフトウェア EIRL aneurysm (エイル アニュリズム)を発売

今年の夏まで約1年間弊社オフィスは「大手町ビル」内に間借りしていたのですが、技術系メンバーのデスクがあったオフィスのお隣がエルピクセル株式会社でした。私が前職時代一緒に仕事をしたことのあるメンバーも何人か働いていてビル内でよくご挨拶していたのですが、同社は今年大きなイノベーションを成し遂げました。ついに彼らの開発した「深層学習を活用した脳MRI画像から脳動脈瘤を検出するAI」がPMDAの審査をパスし管理医療機器として薬事承認を受けたのです。これは、そのAIが出力する結果を参考にして医療従事者が診療行為を行っても良い、とお墨付きが与えられ、日本国内でも「AIが患者さんを助けるのに有効である(臨床観点から効果・効能がある)」と認められたことを意味します。

日本は欧米などと比べて医療用画像診断装置(CTやMRIなど)の設置数が多いにも関わらず読影を担う放射線科医の数が圧倒的に不足しており、その結果、例えば脳神経外科領域では画像診断の専門家ではない脳神経外科医が自ら大量のMRI画像を読影している施設もあり、疾患の見逃しリスクや医師の負担増大が指摘されています。これらの差し迫った課題を解決するため、AIの活用による医療用画像診断プロセスの質標準化・効率化はエルピクセル社のような先駆者のリードにより今後ますます拡大・加速するものと思われます。

執筆者について
シバタアキラ(Shibata Akira)
シバタアキラ(Shibata Akira)

チーフ・データサイエンティスト

DataRobot Japan チーフ・データサイエンティスト。ロンドン大学高エネルギー物理学博士課程修了。ニューヨーク大学でのポスドク研究員時代に加速器データの統計モデル構築を行い「神の素粒子」ヒッグスボゾン発見に貢献。その後ボストン・コンサルティング・グループでコンサルタントとして、主に TMT/製薬業界でのデータ分析業務に従事。AI 型情報キュレーションを提供する白ヤギコーポレーションの創業者兼 CEO を経て2015年に DataRobot Japan の立ち上げに一人目のメンバーとして加わり現職。個人ブログにhttps://ashibata.com/、共著に「データ活用実践教室」(日経BP社)など

 
直近の注目記事
AI活用を成功に導く方法をサービス商品化した米AIベンチャーの狙い(ZDNet Japan)
シバタアキラ氏が伝授#01/データサイエンスって何?(日経ビジネスONLINE)
この人にはこれが売れる/実践!データサイエンス#09(日経ビジネスONLINE)
データサイエンティストになるには?社内で育てる方法は?わかりやすく解説(ビジネス+IT)

シバタアキラ(Shibata Akira) についてもっとくわしく

小川 幹雄
小川 幹雄

DataRobot Japan
VP, Japan Applied AI Experts

DataRobot Japan 3番目のメンバーとして参加。現在は、金融業界を担当するディレクター兼リードデータサイエンティストとして、金融機関のお客様での AI 導入支援から CoE 構築の支援を行いながら、イベント、大学機関、金融庁、経産省などでの講演を多数実施。初期はインフラからプロダクトマネジメント業、パートナリング業まで DataRobot のあらゆる業務を担当。前職はデータマネジメント系の外資ベンダーで分析ソリューション・ビッグデータ全般を担当。

小川 幹雄 についてもっとくわしく

中野 高文(Takafumi Nakano)
中野 高文(Takafumi Nakano)

データサイエンティスト

DataRobot データサイエンティスト。小売・マーケティングのスペシャリストとして、需要予測からダイレクトメールのターゲティングモデルまで様々なテーマで AI を活用し、企業の AI 変革を推進。より多くの人がビジネスで機械学習を活用できるよう DataRobot を使った機械学習の民主化を推し進めている。元リターゲティングのリーディングカンパニー Criteo のデータサイエンスチームリード。デジタルマーケティングや小売でのAI活用関連の研究会講師や講演・寄稿多数。

直近の注目記事
マーケティングと機械学習は相性抜群、データサイエンティストが業務ごとに解説(ビジネス+IT)
AIを使いたい小売・流通業へ、データサイエンティストが教える機械学習活用法(ビジネス+IT)
AI駆動で始まる新たなマーケティングスタイル。AIがマーケティングにもたらす価値(Ledge.ai)
DataRobot 中野さんに聞く:機械学習の民主化がもたらすマーケティング分野でのAI 活用(Unyoo.jp)

中野 高文(Takafumi Nakano) についてもっとくわしく

山本 祐也(Yuya Yamamoto)
山本 祐也(Yuya Yamamoto)

データサイエンティスト

DataRobot データサイエンティスト。Kaggle Master、博士 (工学)。東京大学大学院工学系研究科にて有機無機複合材料の研究で博士号を取得。学位取得後、大手化学メーカーにて液晶・タッチパネル関連先端化学材料の研究開発に従事。その後、大手食品メーカーで機械学習を用いた食品パッケージに関する予測モデリングと最適化に取り組むなど、BtB と BtC いずれにも深い経験を有する。余暇では機械学習コンペティションの Kaggle に精力的に取り組んでおり、 2020年現在も現役で活躍している。

直近の注目記事
もう失敗しない!製造業向け機械学習Tips(4):
偽相関の罠に陥らない、製造業における機械学習を用いた要因分析のコツ
(MONOist)
もう失敗しない!製造業向け機械学習Tips(3):教師データが足りないと「異常予測」は難しい、ならば「異常検知」から始めよう (1/2)(MONOist)
もう失敗しない!製造業向け機械学習Tips(2):機械学習による逆問題への対処法、材料配合や工程条件を最適化せよ(MONOist)
もう失敗しない!製造業向け機械学習Tips(1):機械学習で入ってはいけないデータが混入する「リーケージ」とその対策 (1/2)(MONOist)

山本 祐也(Yuya Yamamoto) についてもっとくわしく

坂本 康昭(Yasuaki Sakamoto)
坂本 康昭(Yasuaki Sakamoto)

データサイエンティスト

DataRobot データサイエンティスト。2005年にアメリカの大学にて認知科学博士号取得後、教授職時代にデータサイエンスプログラムの立上げを経験。2015年に日本に戻り、保険会社で AI の応用に従事。2017年から DataRobot のデータサイエンティストとして金融業界のお客様をサポート。

坂本 康昭(Yasuaki Sakamoto) についてもっとくわしく

伊地知晋平(Shinpei Ijichi)
伊地知晋平(Shinpei Ijichi)

データサイエンティスト

90年代から医療用画像診断装置メーカーで統計解析や機械学習を使った品質改善(シックスシグマ )、要因分析、異常予兆検知、医療データ分析などに従事。2018年からDataRobot社のデータサイエンティストとしてヘルスケアチームをリードし、主に医療機関や製薬企業でのAIアプリケーション開発をサポートしている。また、伝統的な統計解析手法と機械学習各々の特長を活かした分析アプローチを研究し、各所で講演を行っている。

直近の注目記事
医療でのAI実践、病院で機械学習はどう活用されているのか(ビジネス+IT)
製薬業界の機械学習活用をプロセスごとに解説、がん治療をAIが助ける?(ビジネス+IT)

伊地知晋平(Shinpei Ijichi) についてもっとくわしく
投稿をシェアする