一次試験対策

【データ分析用語総まとめ】データマッピング・データマイグレーション・クレンジング・OLAPを徹底解説!/経営情報システム/中小企業診断士試験対策

データ分析関連用語_アイキャッチ
Pocket

はいどうも、中小企業診断士のたかぴーです。
今回は「データ分析の関連用語」をテーマに解説していきたいと思います。

普段の生活の中でもDXやデータ活用といった言葉をよく耳にしますが、試験対策としても、データ分析に関する用語は頻出論点のひとつです。
似たような用語が数多く出てくるので混乱してしまいがちですが、データ分析全体の流れの中で各用語がどのような位置づけなのかを理解することができれば、そこまで難しいものでもありません。
今回は理解を重視した解説を行いますので、ぜひ最後まで読んでいただければと思います。

YouTube動画でも解説中!

データ分析ができるようになるまで

各用語の解説に入る前に、まずはデータを集めて分析できるようになるまでの流れを確認しておきましょう。

分析するためには、複数のデータを統合して、形式が整った形で蓄積して初めてデータ分析ができます。

例えば、あるスーパーマーケットでは、POSデータのほかに、会員アプリのデータ・仕入れ管理データなどが蓄積されていたとします。これらのデータをすべて統合・蓄積して、その上でデータの形を整える整形を行い、分析用のシステムに投入することによって、初めて分析ができるようになるわけですね。

データ分析の世界では、最初からきれいな形にデータが整っていてすぐに分析できることの方が珍しいです。データ分析のためにはこのような前処理が必要であることを理解した上で、このプロセスに沿って各用語を確認していきましょう。

経営情報システム 過去問データブック
1次対策

経営情報システムの頻出用語を10年分集計

IT・ネットワーク・DB用語を出題回数で可視化。AI連携もOK。

Excel付属Quizlet連携2026年度版
無料|お試し

データマッピングとデータマイグレーション

POSデータ・会員アプリ・仕入れ管理データは、それぞれこのような形でデータを持っていたとしましょう。各テーブルの中身を見てみると、商品に関する項目として、POSデータでは「商品コード」、会員アプリでは「商品名」、仕入れ管理データでは「SKU」と表記されています。

同じ内容を指していても、項目名が違ったり、その表現にも違いがあります。ここで「商品コードの0001はSKUではPA01であり、商品名はトマトである」というように対応づけることができれば、トマトがいつ何個仕入れて、どれくらい売れて、誰が買ったのかを一気通貫で分析できるようになります。

このように、異なるシステム間でデータの項目を対応づけることを「データマッピング」といいます。

そして、別々に管理されているストレージ上のデータを、別のシステムやデータベースに移管する手続きのことを「データマイグレーション」といいます。データマイグレーションについては、単にデータを移すことを少しかっこいい言い方をしている、くらいの理解で問題ないかと思います。

このようにして蓄積されたデータベースのことを「データレイク」といいます。レイクは湖という意味の英語ですので、データが貯まっている湖というイメージですね。一方で、どこに何が格納されているかよく分かっていない状態のことを「データスワンプ」という言い方もします。スワンプは英語で沼地を意味する言葉なので、データが汚い形で溜まっている沼というイメージです。

データクレンジングとは?

データクレンジングとは、データの誤りや重複・表記の揺れなどを整えて、分析できる状態にすることをいいます。

例えば、あるデータベースにはこのようなデータが蓄積されていたとしましょう。会員IDを見てみると「04」という形で頭の0が抜けていたり、最後の行が空白になっています。商品名では「トマト」が全角・半角・英語で表記されていたり、文字化けが発生しています。取引日の表記も、桁数・区切り文字・年の有無がバラバラです。

こういった表記の揺れや誤りをすべて整えていくのがデータクレンジングです。データクレンジングを行う前だと「全角のトマトが100個、半角のトマトが50個、英語のトマトが30個売れた」というように集計されてしまい、本来の分析ができなくなります。誤った結論を導かないためにも、非常に重要な作業です。

データクレンジングは、データレイク内だけで行うものではなく、POSデータや会員アプリ、仕入れ管理データの中で行うケースもあります。説明の便宜上、このタイミングで解説していますが、実際はデータ収集の各段階でも行われます。

OLAPとは?

ここまでのデータ前処理を経て、ようやく分析用のシステムにデータを投入できます。診断士試験でよく出題されるのがOLAP(Online Analytical Processing)という分析手法です。

OLAP(オーラップ)

統合・蓄積された多次元データを高速に集計・分析する仕組みやツールのこと。

OLAPではデータベースを立方体のように多次元で表現します。この立方体に対して、以下のような操作を行います。

  • スライシング:データの一部を切り出して分析する(例:「東京における商品別の月別販売数量」)
  • ダイシング:データを見る角度を変えて分析する(例:「1月におけるエリア別・商品別の販売数量」)

OLAPでは、スライシングやダイシングといった形でデータを見る角度や切り口を変えて分析できる、という理解をしておきましょう。ちなみにスライシングは「データを切る」イメージ、ダイシングは「サイコロ(ダイス)を転がして角度を変える」というイメージです。

さらに、OLAPには以下の関連用語もあります。

  • ドリルダウン:さらに細かく分析していくこと(例:「東京における日別の傾向を見る」)
  • ロールアップ:データを集約して分析すること(例:「東京における年別の傾向を見る」)

この辺りはかなり細かい用語ですが、問題文でたまに出てくることがありますので、念のため押さえておきましょう。

最後に、OLAPなどの統計処理や機械学習などを用いて、収集されたデータから傾向や関連性を見出す分析手法のことを「データマイニング」といいます。マイニングは採掘を意味する英単語ですね。AIに関連する論点でもよく出題される用語ですので、しっかりと覚えておきましょう。

過去問を解いてみよう(令和3年度 第8問)

それではここまでの内容を、過去問で復習してみましょう。

意思決定や計画立案のために、データを収集して加工・分析することがますます重要になってきている。以下の文章の空欄A~Dに入る語句の組み合わせとして、最も適切なものを下記の解答群から選べ。

意思決定や計画立案のために、組織内で運用される情報システムやデータベースなどからデータを集めて格納しておく場所を A と呼ぶ。この A から、必要なものだけを利用しやすい形式で格納したデータベースを B と呼ぶ。このような構造化されたデータに加えて、IoT機器やSNSなどからの構造化されていないデータを、そのままの形式で格納しておく C が利用されつつある。膨大なデータを蓄積する必要があるため、比較的安価なパブリッククラウドのオブジェクトストレージに格納される場合が多い。収集されたデータの品質を高めるためには、データ形式の標準化や D が重要である。

ア A:データウェアハウス  B:データマート  C:データレイク  D:データクレンジング

イ A:データウェアハウス  B:データレイク  C:データスワンプ  D:データクレンジング

ウ A:データマート  B:データウェアハウス  C:データプール  D:データマイグレーション

エ A:データマート  B:リレーショナルデータベース  C:データレイク  D:データマイグレーション

オ A:データレイク  B:データマート  C:データプール  D:データマイニング

正解は「ア」です。

空欄A・B(データウェアハウス・データマート)
「組織内のデータを集めて格納しておく場所」→ 企業全体のデータを蓄積・分析向けに整備する場所なのでデータウェアハウスですね。そして「DWHから必要なものだけを利用しやすい形式で格納」→ 特定部署・用途向けに切り出したものなのでデータマートです。

空欄C(データレイク)
「構造化されていないデータをそのままの形式で格納」→ データレイクです。データレイクは構造化データだけでなく、IoT機器・SNSなどからの非構造化データもそのまま格納できる点が重要なポイントです。画像ファイルや動画ファイルのように、表形式に変換できないデータが非構造化データの代表例です。

空欄D(データクレンジング)
「収集されたデータの品質を高める」→ データの誤り・重複・表記ゆれを整えるデータクレンジングです。

データレイクは非構造化データまで扱える、という点は他の年度でも問われています。データウェアハウス・データマートとの違いとあわせてしっかり押さえておきましょう。

まとめ

今回は、データ分析に関連する用語について解説しました。

データ分析は、複数のデータを統合し、形式が整った形で蓄積して初めて分析が行えるようになります。各用語の対応関係を最後にまとめておきます。

  • データマッピング:データベースに格納されているデータを対応づけること
  • データマイグレーション:それらのデータを他のデータベースに移管すること
  • データレイク:データが蓄積される場所(構造化・非構造化データ両方を格納)
  • データスワンプ:どこに何が格納されているか分からない状態のデータの沼
  • データクレンジング:蓄積されたデータを整えて分析できる状態にすること
  • OLAP:多次元データを高速に集計・分析する仕組み(スライシング・ダイシング・ドリルダウン・ロールアップ)
  • データマイニング:収集されたデータから傾向や関連性を見出す分析手法

経営情報システムは各用語の暗記だけだと太刀打ちが難しくなっています。それぞれ何のためにその作業を行っているのかを理解することで、用語の意味も覚えやすくなります。過去問演習と合わせて、理解を深めていきましょう。

データ基盤_アイキャッチ
【データ基盤】ODS・データウェアハウス・データマートの違いをわかりやすく解説!/経営情報システム/中小企業診断士試験対策 はいどうも、中小企業診断士のたかぴーです。 今回は「データ基盤」をテーマに解説していきたいと思います。 今回解説するデータ基盤に関す...

✉ 無料メールマガジン

試験まで、たかぴーが毎月伴走します。

中小企業診断士たかぴーが毎月届けるメールマガジン。その時期にピッタリな勉強計画・直前対策・2次試験対策に関する情報を無料でお届け。

登録無料 | 月1回配信 | 配信停止はいつでも可能

経営情報システム 過去問データブック
1次対策経営情報システム / 10年分データ

経営情報システム 過去問データブック&単語帳(2026年度版)

  • 頻出テクノロジー用語を出題回数で序列化
  • 生成AI(NotebookLM等)連携で自作クイズ化
¥880 税込
無料で試す →
Pocket

ABOUT ME
たかぴー
自己紹介:中小企業診断士。 一次試験は全科目60点超の合計512点という高得点で突破、二次試験は2回連続で合計で240点以上を達成して合格。 合格後は、本業のデータ分析スキルを生かした過去問研究、法人営業経験を生かしたわかりやすい解説で受験者支援を実施中。 チャンネル登録者1.5万人超の「たかぴーの中小企業診断士試験 攻略チャンネル」では、二次試験と中小企業経営・政策も解説。 趣味:ジム・筋トレ、旅行、YouTube、ブログ 連絡先:takapi.channel@gmail.com

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA