「ビッグデータ」とは「さまざまな種類の膨大なデータ」のこと
「ビッグデータ」は言葉のとおり大きなデータを指します。しかし、ただ大きいだけではなく、一般のパソコンやサーバーレベルでは処理しきれないほどの大きなデータを意味する言葉です。
ネット社会の現代においては、世の中に存在するデータの量だけでなく、量も膨大なものです。また、専門職でない人でもIT用語に触れる機会が多くなっているので、ある程度の知識は必要です。
今回は、「ビッグデータ」の特徴、種類のほか、どのように活用されているのかなどもわかりやすく紹介します。
ビッグデータの英語表現
ビッグデータを英語で表すと「big data」ですが、日本語の意味とほぼ同じで「一般的な管理や処理方法では取り扱いが困難なほどの巨大で複雑なデータ」という意味になります。
・big data storage
(ビッグデータの保存)
・big data processing
(ビッグデータ処理)
・analyze big data
(ビッグデータを分析する)
日本語においてのビッグデータとは?
日本語の中で使われている「ビッグデータ」は、ただ膨大なデータというだけではなく、「4v」と呼ばれる4つの特徴をもっています。
Volume(容量)
一般の人たちがよく目にする容量は、KB(キロバイト)、メガバイト(MB)、ギガバイト(GB)だと思います。大容量化が進んでいる現代においてはテラバイト(TB)も登場していますが、一般的にあるものは10TBまでのものがほとんどです。
しかし、ビッグデータとされる容量は数百TB、さらにはその上の単位であるペタバイト(PB)、エクサバイト(EB)にもなる場合があります。
Variety(種類)
ビッグデータとは、コンピュータのプログラムを構成しているデータや、数値データだけではありません。位置情報、テキスト、音声、写真、動画、SNSの投稿データなどすべてのものが含まれます。
Velocity(頻度・スピード)
スーパーやコンビニで取り扱われるPOSデータや、交通系ICカードの情報は、リアルタイムで情報が更新されなければなりません。このように、ビッグデータの中にはスピードも求められるものが多く存在します。
なお、POSとは、「Point Of Sales」の略で、商品が売れた時点を指しており、POSデータは、その商品が売れた日時、場所に対しての実績データを指します。
Value(価値)
ビッグデータの特徴は、value(価値)を除く3vともいわれています。サイトの運営している企業は、売上につながるなどの「価値」がなくては意味がありません。企業としてもビッグデータを取り扱うことに関して「価値」がなければ、利用者が求めるツールやサービスは続きません。また、利用者側も「価値」がなければ使わなくなります。そのため、この「価値」という特徴も要素として重要なものだといえます。
ビッグデータの種類
ビッグデータは、ITの専門職のみが取り扱うデータだけではなく、私たち一般のユーザーが日頃あたりまえに使っているデータも含まれているんです。
【マルチメディアデータ】
Web上で公開されている音声や動画データ。
【ソーシャルメディアデータ】
YouTube、ニコニコ動画、食べログ、アットコスメ、Twitter、Facebookなど、ブログ、動画公開、写真公開などのサービス全般をソーシャルメディアと呼んでいます。そして、その中でも会員登録をして利用者同士が交流できるものをSNSといいます。
これらのサイトに登録されているプロフィールやコメントなどのデータが「ソーシャルメディアデータ」にあたります。
【オフィスデータ】
会社で利用するパソコンのメールや文書などのデータを指します。
【オペレーションデータ】
販売管理システムによる販売時点情報、取引明細の情報を指します。
【センサーデータ】
GPS、交通系ICカード、クレジットカードのICにより検知することができる、乗車履歴、使用履歴、位置情報を指します。
【ログデータ】
サイトにアクセスしてきた人の履歴を「アクセスログ」といい、これらのデータを総称して「ログデータ」と呼んでいます。
ビッグデータの活用事例
ビッグデータは多くの企業で活用されています。ここでは、総務省のサイトからの企業事例を紹介しておきます。
大手飲料メーカーであるダイドードリンコは、コーヒー飲料が主力商品となっています。こちらのメーカーでは、自動販売機で商品のどこを見て認識をしているかを判別する「アイトラッキング・データ」を活用し、これまでの消費者アンケートと併用することで、消費者行動に関するデータ数を増やすことが可能となりました。このデータにより、商品サンプルの配置を決定するなど、販売促進につなげています。
IHIは、航空宇宙エネルギー機器や建機などを取り扱う総合重機メーカーです。この重機の分野で培った技術を利用し、リモートセンシングによる土地・生産物の情報、気象データ、生産者からの情報、GPSデータなどを集め、農業情報サービスとして農業精算法人などに提供しています。
このほかにも、わかりやすい例としては、車のナンバーを自動で読み取る「Nシステム」、選挙速報などがあります。
ビッグデータの類語・言い換え
ビッグデータは「さまざまな種類の膨大なデータ」「巨大で複雑なデータの集まり」などに言い換えるほかはありませんが、類語としては「オープンデータ」があります。
特定のデータが、一切の著作権や特許といった制限がなく、全ての人が利用・再掲載できる形で公開され、入手できるデータを指します。特に行政においては、可能なデータをオープンにすることで、問い合わせや回答にかかる時間を減らせるといったメリットがあります。また、一般の人や企業にとっても情報のオープンデータ化により、新しい技術やアイデアの発展に役立つとされています。
身近なところで「ビッグデータ」を活用しているということを意識しよう
「ビッグデータ」の全体像を目にすることは、一般の人にとってはほぼないでしょう。しかし、生活の中で使っているデータは、さまざまな種類の「ビッグデータ」の一部なので、インターネットを利用する際は、ぜひ「これもビッグデータなんだ」という意識をもってみてください。