構造化データと非構造化データ:AIが解き明かす新たな可能性
私達の周りには、様々な種類のデータがあふれています。これらのデータは、大きく「整理された情報」と「そうでない情報」の二つに分けられます。「整理された情報」は、データベースの表のように、あらかじめ決められた形式に従って整理されているデータのことです。例えば、お店の顧客名簿を考えてみましょう。顧客名簿には、顧客一人ひとりの氏名、住所、電話番号などが分かりやすく並んでいます。このように、一定のルールに従って整理されたデータは、コンピュータが容易に理解し処理できるため、様々な分析に活用できます。顧客の住所情報を分析すれば、どの地域からの来店が多いのかが分かり、効果的な広告戦略を立てることができます。
一方、「そうでない情報」は、特定の形式を持たず、整理されていないデータのことです。例えば、私達が日々やり取りする電子メールを考えてみましょう。電子メールには、仕事の依頼や友人との何気ない会話など、様々な内容が含まれています。これらの情報は、決まった形式で書かれているわけではありません。また、写真や動画、音声データなども「そうでない情報」に分類されます。これらのデータは、コンピュータが理解しにくい形式であるため、分析するためには、まず情報を整理する必要があります。しかし、近年では、人工知能の進歩により、「そうでない情報」からでも、有益な情報を引き出す技術が発展してきています。