CSVファイルを直接ダブルクリックしたら、エクセルが立ち上がったけど文字化けしてしまった。そういう経験をお持ちの方も多いと思います。

CSVファイルはテキストファイルのひとつですが、文字コードによって文字化けが発生してしまうのです。そこで、私が仕事でやっているCSVファイルを取り込む方法を書くことにします。

  1. エクセルを起動する。
    まず、エクセルを立ち上げます(私は Excel 2007と古いのでご容赦を。他バージョンも基本は同じ)
  2. CSVファイルを取り込む準備をする。
    excel_data
    [データ]タブを選択し、[テキストファイル]を押します。
  3. 取り込むCSVファイルを指定する。
    Import_TextData
    対象となるCSVファイルを選び「開く」を押します。
    (ここでは、サンプルとしてUTF-8形式でダウンロードされた日本語法令外国語訳データベースの「標準対訳辞書データ(最新版 v11.0)」を使います。)
  4. CSVデータの形式と文字コードを設定する。
    text_wizard1
    すると、テキストファイルウィザードが立ち上がり、このような画面が現れますので、以下のように設定し、「次へ」を押します。

    • 「元データのファイル形式を選択してください」は「カンマやタブなどの区切り文字によってフィールドごとに区切られたデータ」を選択します。(通常、フィールド区切り文字は、カンマやタブが多いです。)
    • 「元のファイル」は、通常自動的に正しい文字コードが判断されて選択されます。画面下にある「プレビュー」画面をスクロールしてみて、表示されている文字列が化けていなければ、正しい文字コードが選択されています。もし、文字化けがあるようなら、「元のファイル」の文字コードを変更し、文字化けが発生しないものを探して指定します。
  5. フィールドの区切り文字を設定する。
    text_wizard2-1.png
    テキストファイルウィザードの2画面目では、まず、画面下の「プレビュー」画面を見ます。次の画面に見られるようにデータ間に罫線が入っていない場合は、「区切り文字」の設定が正しく行われていません。該当する区切り文字にレ点を入れます。この場合は、「カンマ」のボックスへレ点を入れます。

    【正しく区切り文字が設定された画面】
    text_wizard2-2

  6. 各コラムごとのデータ形式の指定
    text_wizard3
    各列ごとにデータ形式を設定する画面です。エクセルに取り込んでしまってから加工することも可能なので、私は通常、ここで「完了」ボタンを押しています。もし、この段階で形式指定したい場合は、「プレビュー」の列タブを押し(列が反転する)、「列のデータ形式」で設定します。設定が終わったら、「完了」ボタンを押します。
  7. 取り込む先を設定する。
    importData
    データをどこに取り込むかを指定します。良くわからなければ「新規ワークシート」を選択すると良いでしょう。既にあるシート上に貼り付けたい場合は「既存のワークシート」を選択し、取り込む先のセルを指定します。そして「OK」を押すと、エクセルへデータが取り込まれます。
    import_done

~~~~~
ちょっと脱線
~~~~~

もし、CSVファイルが随時アップデートされるようなデータの場合、一度、こういう取り込みをしたエクセルファイルがあれば、「すべて更新」ボタンを押してCSVファイルを指定するだけで取り込み&更新をしてくれるので便利です。(CSVファイルをデータベースと同じ取り扱いにしているんですね)

広告