[前][次][番号順一覧][スレッド一覧]

ruby-reference-manual:2752

From: 5 5 <redmine@r...>
Date: Mon, 4 Jul 2011 16:35:48 +0900
Subject: [ruby-reference-manual:2752] [るりまプロジェクト - Bug #4972][Open] BOM 付き UTF-8 の CSV の扱い


Issue #4972 has been reported by 5 5.

----------------------------------------
Bug #4972: BOM 付き UTF-8 の CSV の扱い
http://redmine.ruby-lang.org/issues/4972

Author: 5 5
Status: Open
Priority: Low
Assignee: 
Category: doc
Target version: 
reporter: 
ruby_version: 


Ruby 1.8 と Ruby 1.9 とでは,csv ライブラリが UTF-8 の CSV ファイルを読み込むときにバイト順マークをどう扱うかが違っているので,それをどこかに書く必要があると思います。

Ruby 1.8 では,CSV の先頭のバイト列 EF BB BF(U+FEFF)は無視します(そういうコードになっている)。

一方,Ruby 1.9 ではこれを特別扱いしないため,第1行第1列の値の先頭に U+FEFF が付いた状態で読み込まれます。
また,たとえば空文字列だけからなる 1 行 1 列の BOM 付き CSV データを表す EF BB BF 22 22 というバイト列を読み込むと,同様の理由で Illegal quoting on line 1. という例外が発生します。
原因が見つけにくいエラーです。


-- 
http://redmine.ruby-lang.org

--
ML: ruby-reference-manual@m...
Info: http://QuickML.com/

[前][次][番号順一覧][スレッド一覧]

->    2752 2011-07-04 09:35 [redmine@r...        ] [るりまプロジェクト - Bug #4972][Open] BOM 付き UTF-8 の CSV の扱い
      3762 2013-06-19 15:18 ┣[redmine@r...        ] [るりまプロジェクト - Bug #4972] BOM 付き UTF-8 の CSV の扱い
      3795 2013-09-02 11:09 ┗[redmine@r...        ] [るりまプロジェクト - Bug #4972][Closed] BOM 付き UTF-8 の CSV の扱い