情報科学でインサイト開発を支援する特任チーム

SD/T

SD/Tとは

SEEDATAは定性調査の持つ力を信じる会社ですがテクノロジーを使わないという意味ではありません。
むしろ定性的なデータこそ、膨大になってくると人の目では追いきれなくなってくるため、IT技術を用いてより情報の特徴を分かりやすく抽出したり話題を整理したりする必要があります。
それに加え、クライアントへのコンサルティング業務の一部分やクライアントに対する情報提供(ニュース配信、レポート)などは、デジタル化することで効率化できるという考えがありました。

そこで、
①我々独自のアルゴリズムを開発し、定性データの分析を人間がおこなうより効果的・効率的におこなうという方向性
②これまで人がおこなってきたことをIT技術を活用し、デジタルトランスフォーメーションするという方向性

つまり、アルゴリズム的側面と、エンジニアリング的側面の2つのイシューの中で、まずはアルゴリズム的側面を開発しようと立ち上げたのがSD/T(technologies)です。

SD/Tのコンセプト

通常、テクノロジーというと情報系の学生でプログラミングができることが前提としてメンバーを集めますが、SEEDATAは先にシステムを作りたかったのではなく、まずはアルゴリズムを作ろうというコンセプトのもとスタートしました。
つまり、
・人間の脳では分析に限界がある、直感に反する、もしくは認知限界の外にあるような発見ができる
・最初にITである程度整理することでプランニングしやすくなる=洞察しやすくなる(ケンタウロス効果)

この両面に対してテクノロジーの力を借りたかったのです。

したがって、プログラミングができることではなく、数学的な素養をベースとした理学系、工学系の学生の中からとくに数学が好きであることを重視しました。
最低限Pythonが分かる、場合によってはベイジアンモデリングでサンプラーを作る際に必要なC++という言語が書ける人などもいますが、理科系で数学が好きな多種多様な情報系以外の大学院生、大学学部生を集めてスタートしました。

SEEDATA独自ライブラリの開発

現在のSD/Tの最終的な目標は、独自のライブラリを開発することです。
たとえば、トピックモデルというさまざまなニュース記事をいくつかのトピックに分解するアルゴリズムがありますが、Pythonという言語を使うとgensimというライブラリに命令するだけで簡単に文章群をトピックに分類することが可能です。
しかし、われわれが実務でイノベーション支援に使うプランニングから考えると、ありもののトピックモデルのライブラリでは能力不足でした。
そこで、われわれに最適な分析するための道具を、数理モデルの面からゼロから構築し、アルゴリズムを作っています。現在はトピックモデルに関するアルゴリズムが完成し、考え方についてはブログで公開しています。

将来的には「SEEDATA」というライブラリを使えば、SEEDATAのおこなう分析ができるようなものになるでしょう。

その他の取り組み

ほかにも、アンケート調査をとり、人間の心の動きや価値観をいくつかのパータンに分類する因子分析という方法がありますが、これもベイジアンモデリングを用いた階層ベイズ因子分析と呼ばれるものに取り組んだり、インタビューの自動書き起こし、posデータに影響する環境的要因、マーケティング的要因、個人的なデモグラフィック変数などをモデリングする階層ベイズを推定していく一般化線形モデルといった、さまざまな研究に取り組んでいます。

このように、大学院などで学ぶ若い人たちの力で自由におこなうことで、おもしろいものを作ろうというコンセプトで研究開発に取り組んでいるのがSD/Tです。クライアント様に研修という形での提供も可能ですので、数学や機械学習について学びたいという方はぜひお問合せください。

 

 

 

 

情報科学を活用したインサイト開発支援をさらに知りたい方はこちら