このページの先頭です

メニューを飛ばして本文を読む

ここから本文です

サイト内の現在位置

教員紹介

新谷 隆彦 准教授 SHINTANI Takahiko

  • 情報システム基盤学専攻
  • データベース学講座
  • shintani(at)is.uec.ac.jp

はじめに

センサや携帯端末などデータ収集技術の発展と普及により,膨大なデータが収集されるようになっています。サーバなど機器のログや企業の業務データだけでなく,人やモノもデータを生み出し続けています。例えば,私たちのPCの操作,携帯電話の利用,買い物の内容,電車やバスの乗降車,施設への入出場など日々の生活行動がデータとして収集されています。

これら膨大なデータを有効に活用するためには,データを利用可能な形で格納し,管理するデータベース技術,データを解析し,有用な情報を見つけ出すデータマイニング技術が必要になります。私は大規模なデータの活用を目的として,データマイニング技術を中心にデータの管理,解析,提示に関する技術を研究しています。

研究内容

実際のデータにデータマイニングを適用しようとした場合,様々な課題が出てきます。以下のような課題について,処理性能と可用性の向上を実現する技術の研究を進めます。

1.データとマイニング結果の管理

処理対象のデータが大規模であることと,データマイニングで得られる結果も膨大になることから,データマイニング処理,データ管理,マイニング結果の管理を切り離さず,1つの問題として扱います。また,データの追加や修正が行われた場合,データマイニングで得られた結果を更新する必要があります。効率良く必要なデータを読み出すこと,マイニング結果に反映させることを可能とするデータマイニングに適した形でのデータ管理を実現します。

2.データの分散配置への対応

データが大規模になると,複数に分散して配置されることがあります。これらを1つ集めてデータマイニングを行うことは処理性能やセキュリティの面から考えて現実的ではありません。データを分散配置させた状態で必要な情報をやり取りすることによって,全データに対するデータマイニングを実現します。

3.データの秘匿性保持

データマイニングが処理対象とするデータは実世界を反映しているため,個人情報が含まれる場合や,複数のデータを繋ぎ合せると個人を特定できてしまう場合などがあり,データの利用が大幅に制限されることがあります。しかし,データマイニングの目的は全データに一般的な傾向や規則性を見つけ出すことであり,個々のデータを知る必要はありません。個々のデータの内容を秘密にしたままで,データマイニングを実現します。

おわりに

多種多様なデータが収集されるようになり,データから価値ある情報を見出すことが情報システムに求められています。データベースやデータマイニングはこの中心的な技術であり,理論と共に実際に使える技術が必要となります。実世界の問題への適用を意識して研究を進めることによって,使える技術を創出していきたいと考えています。

教員紹介