CSV基礎知識
CSVファイルの基本から実践的な活用方法まで
CSVとは?
CSV(Comma-Separated Values)は、カンマ(,)で区切られた値のことで、 表形式のデータを保存するための最もシンプルで広く使われているファイル形式です。
CSVの特徴
- テキストファイルなので軽量
- ほぼすべてのソフトウェアで読み書き可能
- プログラムで処理しやすい
- データベース間のデータ交換に最適
- Webアプリケーションでよく使用される
CSVの基本構造
基本的なCSVファイルの例
名前,年齢,職業 田中太郎,25,エンジニア 佐藤花子,30,デザイナー 鈴木一郎,28,営業
構造の説明
- 1行目(ヘッダー行): 各列の項目名を定義
- 2行目以降(データ行): 実際のデータ
- カンマ(,): 各列を区切る文字
- 改行: 各行を区切る
区切り文字の種類
CSVという名前にも関わらず、実際には様々な文字で区切ることができます。
よく使われる区切り文字
,
カンマ(最も一般的);
セミコロン(ヨーロッパ圏)\t
タブ文字(TSV)|
パイプ文字
日本語環境での注意
- Excel(日本語版)はセミコロン(;)を使用
- Google スプレッドシートはカンマ(,)を使用
- システムによって自動判別される場合もある
文字コードについて
CSVファイルを正しく扱うためには、文字コードの理解が重要です。
UTF-8
- 国際標準
- ほぼすべての文字に対応
- Webで推奨
- 最新システムの標準
Shift-JIS
- 日本語Windows標準
- Excel日本語版で使用
- レガシーシステムで多用
- 日本語以外で問題あり
EUC-JP
- Unix/Linuxで使用
- サーバー環境で多い
- 日本語処理が得意
- 現在は減少傾向
CSVファイルの作成方法
1. Microsoft Excel
- 通常通りExcelでデータを入力
- 「ファイル」→「名前を付けて保存」
- ファイル形式で「CSV(カンマ区切り)」を選択
- 保存ボタンをクリック
注意: 複数シートがある場合は、アクティブなシートのみが保存されます。
2. Google スプレッドシート
- Google スプレッドシートでデータを作成
- 「ファイル」→「ダウンロード」
- 「カンマ区切りの値(.csv、現在のシート)」を選択
- 自動でダウンロード開始
3. テキストエディタ
メモ帳、VS Code、Sublime Textなどで直接作成
商品名,価格,在庫 りんご,100,50 バナナ,80,30 オレンジ,120,25
拡張子を.csv
にして保存
よくある問題と対処法
問題: 文字化けが発生する
日本語が「?????」や「縺サ縺翫↑繧薙□」のように表示される
対処法:
- 文字コードをUTF-8で保存し直す
- Excelの場合は「UTF-8 CSV」形式で保存
- CSVツールキットの文字コード変換機能を使用
問題: カンマが含まれるデータで列がずれる
「田中, 太郎」のようにデータ内にカンマがあると列が分割される
対処法:
- ダブルクォートで囲む: "田中, 太郎"
- 区切り文字をセミコロン(;)に変更
- カンマを全角(,)に変更
問題: 数値が勝手に変換される
電話番号「090-1234-5678」が「90123-45678」になる
対処法:
- ダブルクォートで囲む: "090-1234-5678"
- 先頭にアポストロフィ: '090-1234-5678
- テキスト形式で読み込み
CSVの活用場面
ビジネス活用
- 顧客データの管理・分析
- 売上データの集計・レポート
- 在庫管理システムのデータ交換
- 会計ソフトとの連携
- メールアドレスリストの管理
- アンケート結果の集計
技術的活用
- データベース間のデータ移行
- ログファイルの分析
- APIレスポンスのデータ出力
- 機械学習のデータセット
- 設定ファイルやマスターデータ
- バックアップ・リストア