最近では、システム担当者だけでなく、一般の事務職や営業の人も「CSVファイル」の簡単な処理をすることが増えています。CSVファイルをExcelに取り込んだ後、Excelで資料を作成することもあります。
ところが、CSVファイルについて丁寧に教えてくれる人が周りにいないために、システム担当者には考えられないような「珍プレー」が続出して、仕事の効率が悪くなっている例もあります。まず、CSVを扱う仕事をするのであれば「CSVとは何か」を理解しなければなりません(本気で理解したい初心者のためのCSV勉強会資料)。そして、CSVとExcelの違いをしっかりと考えなければなりません。
今回は、CSVファイルの取り込みについて、具体的な事例で集中的に鍛えます。何回も繰り返し練習しましょう。
問題
初心者がテキストファイルをExcelに取り込むことを学ぶ場合、どのような練習をすればよいか、具体例を述べなさい。ただし、この問題で初心者とはExcel検定3級相当のスキルを有している者とする。
解説
- 1.文字列の表示形式(復習)
- 2.区切り位置指定ウィザード(復習)
- 3.(ここからが本番)テキストファイルウィザード
- 4.拡張子がDATの場合
- 5.数値を標準に戻す
- 6.CSV取り込み演習(1)北海道の郵便番号データ
- 7.CSV取り込み演習(2)標準地域コード
- 8.なぜ「文字化け」するのか
- 9.エクスポートしてからインポート?
- 10.CSV取り込み演習(3)アドレス帳を取り込む
- 11.サンプルのファイルはこちら
- 12.動画版はこちら(無料)
1.文字列の表示形式(復習)
メモ帳(Notepad)に次のように入力したとします。間が空いているのはタブ[Tab]です。
これをコピーしてエクセルに貼り付けます。自動で変換されます。
このように、あるデータを、Excelのルールにしたがって表示することを「読み込み(Read)」または「取り込み(Import)」といいます。Excelに取り込むときに、Excelのルールに従いますので、表示形式が標準の場合は自動変換の機能が働きます。
今度は、貼り付ける前に、セル範囲A1:D3を選択して「文字列」の表示形式を設定しておきます。
貼り付けると今度は変換されません。文字列の表示形式にしてから貼り付けると自動変換を止めることができます。
2.区切り位置指定ウィザード(復習)
次のような、半角のカンマで区切られているテキストデータがあったとします。
これをコピーして、Excelに貼り付けます。カンマは単なる記号なので、すべてA列に貼り付けとなります。
これを選択して、区切り位置を選びます。
区切り位置指定ウィザード(1/3)が開きます。
次に進んで、カンマを選択します。
表示先がA1になっていることを確認して完了します。
カンマで分割されました。原則として、Excelに貼り付けた、区切り文字のあるデータは「区切り位置指定ウィザード」によって分割します(参考:【Excel】区切り位置指定ウィザードを使った並べ替えと応用事例のまとめ)。
3.(ここからが本番)テキストファイルウィザード
次のようなCSVファイルがあったとします。(行の先頭に0がある)
エクセルを起動します(新規ブック)。
[データ]、[外部データの取り込み]の中の、[テキストファイル]を選びます。
「テキストファイルのインポート」と表示されます。さきほどのCSVファイルを選びます。
テキストファイルウィザードが表示されます。次へ進みます。
カンマにチェックを入れると、6列に分かれます。次へ進みます。
一番左の列を選択します。
[Shift]キーを押しながら一番右の列を選択します。これで6列選択できます。
データ形式を「文字列」にかえると、すべての列が「文字列」にかわります。これで完了します。
このままでも構いませんが、新規ワークシートにします。
新しいシートに取り込まれます。(先頭の0が消えていない)
CSVファイルをExcelに取り込むには、テキストファイルウィザードを使います。このとき、データ形式を「文字列」にすると、Excelの自動変換による表示の崩れを防ぐことができます。
このように、テキストファイルの中身をExcelに読み込んで利用することを「インポート(Import)」といいます。「取り込み」ともいいます。取り込みとインポートは同じ意味です。
*補足説明*
CSVファイルを直接開くとExcelが起動しますが、「CSV」を開いているので、タイトルバーにはCSVのファイル名が表示されます。
これに対して、インポートは、CSVのデータをExcelに入力しているのと同じ(コピー貼り付けと同じ)なので、出来上がったファイルは「Excel」です。
したがって、タイトルバーは「Book1」のままです。
4.拡張子がDATの場合
次のような拡張子DAT(.dat)のファイルがあったとします。
DATとは、データの略です。拡張子を考えるのが面倒なときに、とりあえず適当につけておく拡張子です。適当な拡張子なので、ファイルの種類も不明で、テキストファイルかどうかも分かりません。
セキュリティ上、中身が分からないファイルを直接開いたり、Excelに取り込んだりしてはいけません。ファイルの作成者に確認して、ファイルの種類が「区切りのあるテキストファイル」であることが事前に確認できる場合に限り、Excelで利用することができます。
これがテキストファイルであると事前に分かっている場合は、メモ帳でファイルの中身と区切り文字を確認します。ハイフンで区切られているようです。これをExcelに取り込んでみましょう。
ところで、さきほどCSVを取り込みました。同じExcelに、2つ以上のテキストファイルを取り込むことも可能ですが、別のシートにする必要があります。
先ほどと同じ操作方法でテキストファイルウィザードの画面を開きます。DATファイルが表示されないときは、すべてのファイルにします。
その他にチェックを入れて、半角のハイフンを入力すると、3列に分かれます。
次へ進みます。ここで、3列選択して文字列にします。
これで完成です。テキストファイルであれば、拡張子(CSV、TXT、DAT、TSV ・・・)の種類にかかわらず、区切り文字を確認してテキストファイルウィザードによって取り込みます。
5.数値を標準に戻す
原則として、テキストファイルウィザードによって取り込むときには、Excelによる自動変換機能を止めるため、「文字列」の形式で取り込みます。表示形式は「文字列」になります。
B列とC列の表示形式が文字列になっているのを標準にします。カンマ桁区切りにします。カンマがつきません。
このように、いったん文字列で取り込んだ場合、数値として扱うことができません。B列を選択して、区切り位置指定ウィザードを開いて、何もせずにそのまま完了します。
区切り位置指定ウィザードを適用すると、完全に標準の書式になります。これで数値になってカンマ桁区切りになります。
C列も同じように数値にします。文字列になってしまった数値を、標準の数値に戻すには、区切り位置指定ウィザードを使います。
6.CSV取り込み演習(1)北海道の郵便番号データ
郵便局のサイトには、郵便番号のデータをダウンロードできるサービスがあります。都道府県別の郵便番号と、大企業に特別に割り当てられた事業所個別郵便番号が公開されています。
郵便番号データダウンロードhttp://www.post.japanpost.jp/zipcode/download.html
「CSV形式」と書いてあります。
北海道のファイルをダウンロードすると、このようなCSVファイルを取得することができます。(北海道の郵便番号は先頭が0なので、練習に最適です)
ところで、なぜCSVで公開しているのでしょうか?
ExcelファイルはExcelでしか開けないので不便です。CSVファイルはテキストファイル(文字コード以外の無駄な情報が無い)なので、Excelに限らずその他のソフトやデータベースシステムにもインポートすることができます。Excelが入っていないパソコンでも扱うことができます。また、いっぱんに、Excelファイルで配布するよりも、CSVで配布したほうがサイズが小さいので、このような一覧表はCSVで配布することが多いです。
郵便局のサイトには、データの説明として、ファイルが15個の項目を表していること、そして、カンマ区切りで15列あるということの説明があります。
郵便番号データの説明 - 日本郵便
https://www.post.japanpost.jp/zipcode/dl/readme.html
ダウンロードして取得した、CSVファイルを適当な場所に保存します。
そして、さきほどと同じ要領で、テキストファイルウィザードによって取り込みます。
すべての列を選んで、文字列にします。郵便番号のデータのように、インターネットで公開されているCSVは、Excelの自動変換機能の影響があるかどうかがわからないので、すべての列を文字列にしておきます。
先頭が0の郵便番号も正しく表示されます。
7.CSV取り込み演習(2)標準地域コード
「標準地域コード」で検索して、総務省が公開している「統計に用いる標準地域コード」のページを探します。
(総務省トップ→国民生活と安心安全→標準地域コード)
総務省|統計基準・統計分類|統計基準・統計分類
http://www.soumu.go.jp/toukei_toukatsu/index/seido/kijun.htm総務省|政策統括官(統計基準担当)|統計に用いる標準地域コード
http://www.soumu.go.jp/toukei_toukatsu/index/seido/9-5.htm
CSV形式と書いてある「全国」のデータをダウンロードして保存します。
(右クリック→リンク先のファイルを保存)
先ほどと同じ要領で、テキストファイルウィザードによって取り込みます。すべての列を「文字列」にしておきます。これが、全国の市町村のコード番号の一覧表です。
8.なぜ「文字化け」するのか
インターネットでダウンロードして保存したCSVファイルがあります。
直接Excelで開いたら文字化けします。原則として、CSVファイルをExcelで直接開いてはいけません。特に、インターネットで取得したCSVファイルは、テキストファイルウィザードによって取り込みます。
テキストファイルウィザードによって取り込みます。ここで、文字コードがUnicode(ユニコード)、UTF-8になっていることに注意します。
世界中にはたくさんの文字コードが存在します。1種類ではありません。
JIS、Shift_JIS、EUC、Unicode16、UTF-8(N)、・・・・・・
この中で、Excelで使用する文字コードは、JIS日本工業規格が定めるShift_JIS(シフトジスコード)です。Shift_JIS以外のコードを用いたファイルを、Excelで開くと文字化けとなります。
特に、最近、インターネットではUTF-8と呼ばれる文字コードが使われることが多いため、インターネットで公開されているCSVもUTF-8であることが多いです。ちなみに、このブログ(はてなブログ)もUTF-8です。
例えば、このサイトのように、文字コードがUTF-8のため、Excelで直接開いてはいけないという注意書きを載せているサイトもあります。
ちなみに、郵便局の郵便番号データは、Shift_JISです。このように、CSVを利用するときには文字コードを事前に確認しておくとよいでしょう。
この画面で、文字コードがUTF-8で、文字化けしていないことを確認します。
(この方法でも文字化けすることがたまにあります)
今回は、左の2列だけを選んで、文字列にします。
左の2列は「文字列」、それ以外は「標準」の表示形式で取り込まれます。
このように、一部の列だけ文字列にして取り込んでも構いません。
9.エクスポートしてからインポート?
業務で用いるデータベースシステムは、特殊なデータ形式でデータを保存しています。
これによって、大量なデータを扱い、高速に集計・処理をすることができます。データベースシステムの画面に表示される情報は、実際には、サーバーに保存されているデータで、CSVの形式ではありません。
このようなシステムには、保存されているデータのうち、一部だけを取り出してCSVの形式に変換する機能があります。
この機能を用いてパソコンにCSVを保存したとします。これを「CSVをエクスポートする」または「CSVを出力する」または「CSVを吐き出す」といいます。
システムからデータを取り出して、CSVとして保存するのがエクスポート、そのCSVファイルをExcelに取り込むのがインポートです。
これは、販売管理システムのデモ画面です。商品情報を検索したら3件見つかったという状況を表しています。
ファンダメンタルExcel_Program 10-14. CSV事例演習1(エクスポート)
https://waenavi.jp/htm/fx10-14.html
この表をExcelで利用するために、CSVを出力する、つまり、エクスポートします(ちなみに文字コードはShift_JISです)。CSVを保存する画面が表示されますので、パソコンの任意の場所に保存します。
そして、テキストファイルウィザードで取り込みます。
10.CSV取り込み演習(3)アドレス帳を取り込む
パソコンのメールソフトやインターネット上で見るメール、いわゆるWEBメールには、アドレス帳があります。アドレス帳も、CSVではない特殊なデータ形式で保存されたデータです。
アドレス帳が見つからない場合には、「使っているメールの名前、アドレス」で検索して調べます。
電子メールのアドレス帳にも、CSVでエクスポートする機能があります。エクスポートする画面が見つからない場合は、「使っているメールの名前、アドレス、エクスポート」で検索をすると、エクスポートの方法を解説したマニュアルのページが見つかります。
CSVで保存する画面が表示されますが、表示されない場合は、パソコンの「ダウンロード」のフォルダに保存されます。テキストファイルウィザードで取り込みます。
このファイルを保存すると、「Excel」の形式で保存することができます。
11.サンプルのファイルはこちら
わえなび公式サイト(waenavi.jp)では、この記事で使用しているExcelのデータを無料で配布しています。ご自由にお使いください。
ファンダメンタルExcel_Program 10. CSVファイル | わえなび [waenavi] the Theory of Word-Excel
12.動画版はこちら(無料)
CSVの基本的な知識から、CSVを保存する方法まですべて解説した動画版(完全版)は、Youtubeにすべて無料で公開しております。ぜひ、ご覧ください。
ファンダメンタルExcel 10 CSVファイル(全16回)【わえなび】 - YouTube
https://www.youtube.com/playlist?list=PLRaY8kd5CoxO3pLNr9XniSBBg88rBLZ2l