Excelでピボットテーブル(Pivot Table)を使うのは集計だけではありません。別の記事でも解説しましたが、重複なくデータを抽出したり、コード表を作ったりするときにも使います(
)。その他に、ピボットテーブルを用いて、元の表のデータが正しく入力されているかを確認することができます。事前にミスがないことを確認することも重要な集計作業の一つです(※参考:Excelデータクレンジングの「議論」をしよう)。不正なデータを早く見つけることができたら、何回も集計をやり直さなくても済みます。
そこで、今回はピボットテーブルを用いて入力データの点検作業をすることについて出題します。
目次
1.準備(サンプルファイルはこちら)
わえなび公式サイト(waenavi.jp)では、この記事で使用しているExcelのデータを無料で配布しています。ご自由にお取りください。7-27、7-27-2の「サンプルファイル(ZIP)」です。
2.何を点検すればよいか
問題
48名の学生を、A、B、Kの3班に分けて、それぞれ班長と副班長を1名ずつ選出した。さらに1組~8組に分けて、A班、B班、K班の学生が2名ずつになるようにした。データに誤りがないことを確認するには、どのようなことを点検すればよいか全て挙げなさい。
解説
(1)レコード件数
ピボットテーブルを挿入します。
氏名を「値」のフィールドにドラッグします。
これで48人の学生が入力されていることが確認できます。リストで最初に確認するのは、全部で何件のデータがあるかを確認することです。これをレコード件数といいます。
(2)重複がないことの確認
48件のレコードに重複がないことを確認します。氏名を「行」のフィールドにドラッグします。
全部「1」になります。
これで48名の学生がダブることなく入力されているものと推定できます。このようにピボットテーブルを用いてレコードの数を求めることによって、重複や矛盾がないことが確認できます。これによって、正しい作業をしているものと推定できます。
推定できるだけであって、元のデータが完全に正しいことを保証するものではありませんが、ミスを未然に防いだり、ミスの原因を探すことができます。
例えば、リストを作った人からチェックを頼まれた場合、ピボットテーブルでチェックをします。
(3)グループが正しく入力されているか
次に氏名の代わりに班を「行」のフィールドにドラッグします。
16人ずつになります。これで同じ人数になっていることがわかります。
仮に、班が割り当てられていない人がいれば、空白の数が表示されるはずです。このように数を数えることによってミスを見つけることができます。
代表者を列のフィールドにドラッグします。
班長と副班長が1名ずつ選出され、そのほかに14人ずついることがわかります。これで正しくグループ分けができたことを確認することができます。
(4)クロス集計によるカウント
組を「行」のフィールドにドラッグします。氏名を「値」のフィールドにドラッグします。
これで6人ずつに分かれていることがわかります。
班を「列」のフィールドにドラッグします。
2人ずつに分かれていることがわかります。
3.変更によるピボットテーブルの更新
問題
48名の学生を3チームに分けて、それぞれ班長と副班長を1名ずつ選出した。
このリストを用いてピボットテーブルを作成した。
さらに、次のように変更しなさい。
(1)学生番号02番 班長に昇格
(2)学生番号05番 Aチーム(班長)に移籍
(3)学生番号07番 Bチームに移籍、副班長に昇格
(4)学生番号08番 総監督に昇格
解説
Bチーム副班長だった学生番号02番が班長に昇格したとします。これでBチームの班長は2人になるはずです。
しかし、ピボットテーブルを見ても変わっていません。
更新のボタンを押します。2人になりました。
元のリストを変えた場合、それに基づいてピボットテーブルを作っている場合には、必ず更新します。
学生番号05番のチームをAにします。学生番号07番のチームをBにして副班長にします。そして、学生番号08番を総監督にします。
ピボットテーブルを更新します。各チームの人数は16人ずつで、班長と副班長が1人ずつになっています。これで元のリストが正しく変更できたものと推定することができます。
4.応用問題:アンケート回答の点検
問題
来場者100名からアンケートの回答を得たので、その質問と100人分の回答を入力した。
入力にミスがないか確認しなさい。
解説
(1)バックアップを取ること
このように大量のデータを人間の目で確認することは不可能です。そこでピボットテーブルを用いて点検しましょう。
まず点検をする前にバックアップを取ります。シート自体をコピーするか、別の名前を付けてファイルを保存します。
データを点検するときには、点検をしている最中にデータが消えるのを防ぐため、かならずバックアップを取ります。
(2)データの個数に矛盾がないこと
次にデータの個数に矛盾がないことを確認します。
8行目以降の回答データでピボットテーブルを作ります。
回答用紙のナンバーを「値」のフィールドにドラッグします。「値」フィールドの設定を変えて、データの個数にします。
101になります。
同じデータを2回入力している可能性があります。
8行目にオートフィルタを設定します。オートフィルタを設定します。オートフィルタを使えば不正なデータを素早く見つけることができます。同一のデータが2つあります。
行を削除します。
ピボットテーブルを更新して確認します。
(3)数値データが正しい範囲に収まっていること
質問1から順に回答数を確認します。空白があることがわかります。実際の回答用紙を見て、入力漏れなのか無回答なのかを確認します。
同じように質問2を見ます。回答数は正しいですが、6という回答があります。
質問2は1から5までの選択肢しかありません。
数値データの場合はその範囲内に収まっていることも同時に確認します。
オートフィルタで確認します。6という入力がありますがこれは明らかに間違いです。
実際の回答用紙を見て確認します。
修正したら必ず更新ボタンを押して確認します。
質問3は複数回答です。複数回答の場合は、回答で選んでいる選択肢に1と入力して、フラグを立てています。
選択肢4で2という数値が見つかりました。
1に修正します。
選択肢5は数値ではないものが見つかりました。
実際の回答用紙を見て、確認します。
また、フラグを「1」にしているので、合計を求めると回答個数になります。複数回答で回答した個数をSUM関数で求めます。
これもフィルタで確認します。0=回答していないものが見つかりました。
実際の回答用紙を見て、入力漏れなのか無回答なのかを確認します。
(4)同じ意味で異なる表記をしていないこと
最後に質問4ですが、回答は東京または大阪しかありません。しかし、なぜか東京も大阪も2つに分かれています。
大阪は漢字の入力のミス、東京はスペースが入っていることが原因です。
日本語で入力されているものは、同じ意味で違う入力がされていないか、入力ミスがないを確認します。
(5)日本語を大量に入力するのは間違い
なお、日本語で大量のデータを入力するのは間違いです。
このように数値や記号で入力するようにします。
解説は以上です。
5.動画版はこちら(無料)
この記事は、わえなびファンダメンタルExcel Program7-27、7-27-2 の動画の内容を書き起こし、加筆修正したものです。
動画版(完全版)は、Youtubeにすべて無料で公開しております。ぜひ、ご覧ください。