Ruby 1.9.3 リファレンスマニュアル > ライブラリ一覧 > 組み込みライブラリ > Encodingクラス

class Encoding + Object

クラスの継承リスト: Encoding < Object < Kernel < BasicObject

要約

文字エンコーディング(文字符号化方式)のクラスです。Rubyの多言語対応(M17N)機能において利用されます。

例えば文字列オブジェクトは、文字列のバイト表現の他にそのバイト表現がどのエンコーディングによるものであるかも併せて保持しています。この情報は String#encoding により取得できます。 Encoding オブジェクトを返すメソッドにはこの他に IO#internal_encoding, IO#external_encoding などがあります。

@see 多言語化

特異メソッド

aliases -> Hash

エンコーディングの別名に対して元の名前を対応づけるハッシュを返します。

例:

p Encoding.aliases
#=> {"BINARY"=>"ASCII-8BIT", "ASCII"=>"US-ASCII", "ANSI_X3.4-1986"=>"US-ASCII",
    "SJIS"=>"Shift_JIS", "eucJP"=>"EUC-JP", "CP932"=>"Windows-31J"}
compatible?(obj1, obj2) -> Encoding | nil

2つのオブジェクトのエンコーディングに関する互換性をチェックします。 互換性がある場合はそのエンコーディングを、 ない場合は nil を返します。

引数が両方とも文字列である場合、互換性があるならば その文字列を結合できます。この場合返り値のエンコーディングは 結合した文字列が取るであろう Encoding オブジェクトを返します。

Encoding.compatible?("\xa1".force_encoding("iso-8859-1"), "b")
#=> #<Encoding:ISO-8859-1>

Encoding.compatible?(
  "\xa1".force_encoding("iso-8859-1"),
  "\xa1\xa1".force_encoding("euc-jp"))
#=> nil

引数が文字列でない場合でも、両方のオブジェクトが encoding を持つ場合には 互換性を判定することができます。

Encoding.compatible?(Encoding::UTF_8, Encoding::CP932)
# => nil
Encoding.compatible?(Encoding::UTF_8, Encoding::US_ASCII)
# => #<Encoding:UTF-8>
[PARAM] obj1:
チェック対象のオブジェクト
[PARAM] obj2:
チェック対象のオブジェクト
default_external -> Encoding

規定の外部エンコーディングを返します。

入出力において、外部エンコーディングが指定されていない場合の規定値として利用されます。Rubyはロケールまたは -E オプションに従って default_external を決定します。ロケールの確認・設定方法については各システムのマニュアルを参照してください。

default_external は必ず設定されます。Encoding.locale_charmap が nil を返す場合には US-ASCII が、 ロケールにRubyが扱えないエンコーディングが指定されている場合には ASCII-8BIT が、default_external に設定されます。

[SEE_ALSO] locale(1), Encoding.locale_charmap

default_external=(encoding)

規定の外部エンコーディングを設定します。

default_internal -> Encoding | nil

規定の内部エンコーディングを返します。

default_internal=(encoding)

規定の内部エンコーディングを設定します。

find(name) -> Encoding

指定された name という名前を持つ Encoding オブジェクトを返します。

[PARAM] name:
エンコーディング名を表す StringSymbol を指定します。
[RETURN]
発見された Encoding オブジェクトを返します。
[EXCEPTION] ArgumentError:
指定した名前のエンコーディングが発見できないと発生します。

特殊なエンコーディング名として、ロケールエンコーディングを表す locale、default_external を表す external、default_internal を表す internal、ファイルシステムエンコーディングを表す filesystem があります。

例:

p Encoding.find(:Shift_JIS)    #=> #<Encoding:Shift_JIS>
p Encoding.find("utf-8")       #=> #<Encoding:UTF-8>
list -> [Encoding]

現在ロードされているエンコーディングのリストを返します。

例:

Encoding.list
=> [#<Encoding:ASCII-8BIT>, #<Encoding:EUC-JP>,
    #<Encoding:Shift_JIS>, #<Encoding:UTF-8>,
    #<Encoding:ISO-2022-JP (dummy)>]

Encoding.find("US-ASCII")
=> #<Encoding:US-ASCII>

Encoding.list
=> [#<Encoding:ASCII-8BIT>, #<Encoding:EUC-JP>,
    #<Encoding:Shift_JIS>, #<Encoding:UTF-8>,
    #<Encoding:US-ASCII>, #<Encoding:ISO-2022-JP (dummy)>]
locale_charmap -> String | nil

ロケールエンコーディングを決定するために用いる、locale charmap 名を返します。nl_langinfo 等がない環境では nil を、miniruby では ASCII_8BIT を返します。

Debian GNU/Linux
  LANG=C
    Encoding.locale_charmap  => "ANSI_X3.4-1968"
LANG=ja_JP.EUC-JP
    Encoding.locale_charmap  => "EUC-JP"

SunOS 5
  LANG=C
    Encoding.locale_charmap  => "646"
  LANG=ja
    Encoding.locale_charmap  => "eucJP"

[SEE_ALSO] charmap(5)

name_list -> [String]

利用可能なエンコーディングの名前を文字列の配列で返します。

例:

p Encoding.name_list
#=> ["US-ASCII", "ASCII-8BIT", "UTF-8",
     "ISO-8859-1", "Shift_JIS", "EUC-JP",
     "Windows-31J",
     "BINARY", "CP932", "eucJP", ...]
new -> Object

Objectクラスのインスタンスを生成して返します。

some = Object.new
p some #=> #<Object:0x2b696d8>

インスタンスメソッド

self !~ other -> bool

自身が other とマッチしない事を判定します。

self#=~(obj) を反転した結果と同じ結果を返します。

[PARAM] other:
判定するオブジェクトを指定します。

[SEE_ALSO] Object#=~

self == other -> bool

オブジェクトと other が等しければ真を返します。

このメソッドは各クラスの性質に合わせて再定義すべきです。 多くの場合、オブジェクトの内容が等しければ真を返すように (同値性を判定するように)再定義されることが期待されています。

デフォルトでは equal? と同じオブジェクト の同一性判定になっています。

[PARAM] other:
比較するオブジェクトです。
p("foo" == "bar") #=> false
p("foo" == "foo") #=> true

p(4 == 4) #=> true
p(4 == 4.0) #=> true

[SEE_ALSO] Object#equal?,Object#eql?

self === other -> bool

メソッド Object#== の別名です。 case 式で使用されます。このメソッドは case 式での振る舞いを考慮して、 各クラスの性質に合わせて再定義すべきです。

一般的に所属性のチェックを実現するため適宜再定義されます。

when 節の式をレシーバーとして === を呼び出すことに注意してください。

また Enumerable#grep でも使用されます。

[PARAM] other:
比較するオブジェクトです。
age = 12
result =
case age
when 0 .. 2
  "baby"
when 3 .. 6
  "little child"
when 7 .. 12
  "child"
when 13 .. 18
  "youth"
else
  "adult"
end

puts result #=> "child"

def check arg
  case arg
  when /ruby(?!\s*on\s*rails)/i
    "hit! #{arg}"
  when String
    "Instance of String class. But don't hit."
  else
    "unknown"
  end
end

puts check([]) #=> unknown
puts check("mash-up in Ruby on Rails") #=> instance of String class. But not hit...
puts check("<Ruby's world>") #=> hit! <Ruby's world>

[SEE_ALSO] Object#==, Range#===, Module#===, Enumerable#grep

self =~ other -> nil

右辺に正規表現オブジェクトを置いた正規表現マッチ obj =~ /RE/ をサポートするためのメソッドです。 常に nil を返します。

この定義により、=~ が再定義されたオブジェクトでは正常にマッチを行い、 それ以外のものは nil を返すようになります。

[PARAM] other:
任意のオブジェクトです。結果に影響しません。
obj = 'regexp'
p(obj =~ /re/) #=> 0

obj = nil
p(obj =~ /re/) #=> nil

[SEE_ALSO] String#=~

send(name, *args) -> object
send(name, *args) { .... } -> object
__send__(name, *args) -> object
__send__(name, *args) { .... } -> object

オブジェクトのメソッド name を args を引数に して呼び出し、メソッドの実行結果を返します。

ブロック付きで呼ばれたときはブロックもそのまま引き渡します。

send が再定義された場合に備えて別名 __send__ も 用意されており、ライブラリではこちらを使うべきです。また __send__ は再定義すべきではありません。

send, __send__ は、メソッドの呼び出し制限 にかかわらず任意のメソッドを呼び出せます。 クラス/メソッドの定義/呼び出し制限 も参照してください。

[PARAM] name:
文字列かSymbol で指定するメソッド名です。
[PARAM] args:
呼び出すメソッドに渡す引数です。
p -365.send(:abs) #=> 365
p "ruby".send(:sub,/./,"R") #=> "Ruby"


class Foo
  def foo() "foo" end
  def bar() "bar" end
  def baz() "baz" end
end

# 任意のキーとメソッド(の名前)の関係をハッシュに保持しておく
# レシーバの情報がここにはないことに注意
methods = {1 => :foo,
  2 => :bar,
  3 => :baz}

# キーを使って関連するメソッドを呼び出す
# レシーバは任意(Foo クラスのインスタンスである必要もない)
p Foo.new.send(methods[1])      # => "foo"
p Foo.new.send(methods[2])      # => "bar"
p Foo.new.send(methods[3])      # => "baz"

[SEE_ALSO] Object#method, Kernel.#eval, Proc, Method

_dump(limit) -> String

Marshal.#dump において出力するオブジェクトがメソッド _dump を定義している場合には、そのメソッドの結果が書き出されます。

バージョン1.8.0以降ではObject#marshal_dump, Object#marshal_loadの使用 が推奨されます。 Marshal.dump するオブジェクトが _dump と marshal_dump の両方の メソッドを持つ場合は marshal_dump が優先されます。

メソッド _dump は引数として再帰を制限するレベル limit を受 け取り、オブジェクトを文字列化したものを返します。

インスタンスがメソッド _dump を持つクラスは必ず同じフォー マットを読み戻すクラスメソッド _load を定義する必要があり ます。_load はオブジェクトを表現した文字列を受け取り、それ をオブジェクトに戻したものを返す必要があります。

[PARAM] limit:
再帰の制限レベルを表す整数です。
[RETURN]
オブジェクトを文字列化したものを返すように定義すべきです。
class Foo
  def initialize(arg)
    @foo = arg
  end
  def _dump(limit)
    Marshal.dump(@foo, limit)
  end
  def self._load(obj)
    p obj
    Foo.new(Marshal.load(obj))
  end
end
foo = Foo.new(['foo', 'bar'])
p foo                      #=> #<Foo:0xbaf234 @foo=["foo", "bar"]>
dms = Marshal.dump(foo)
p dms                      #=> "\004\bu:\bFoo\023\004\b[\a\"\bfoo\"\bbar"
result = Marshal.load(dms) #=> "\004\b[\a\"\bfoo\"\bbar" # self._load の引数
p result                   #=> #<Foo:0xbaf07c @foo=["foo", "bar"]>

インスタンス変数の情報は普通マーシャルデータに含まれるので、上例 のように _dump を定義する必要はありません(ただし _dump を定義すると インスタンス変数の情報は dump されなくなります)。 _dump/_load はより高度な制御を行いたい場合や拡張ライブラリで定義し たクラスのインスタンスがインスタンス変数以外に情報を保持する場合に 利用します。(例えば、クラス Time は、_dump/_load を定義して います)

[SEE_ALSO] Object#marshal_dump,Object#marshal_load

ascii_compatible? -> bool

自身が ASCII 互換のエンコーディングである場合真返します。 そうでない場合は偽を返します。

例:

Encoding::UTF_8.ascii_compatible?     #=> true
Encoding::UTF_16BE.ascii_compatible?  #=> false
class -> Class

レシーバのクラスを返します。

p "ruby".class #=> String
p 999999999999999.class #=> Bignum
p ARGV.class #=> Array
p self.class #=> Object
p Class.class #=> Class
p Kernel.class #=> Module

[SEE_ALSO] Class#superclass,Object#kind_of?,Object#instance_of?

clone -> object
dup -> object

オブジェクトの複製を作成して返します。

dup はオブジェクトの内容, taint 情報をコピーし、 clone はそれに加えて freeze, 特異メソッドなどの情報も含めた完全な複製を作成します。

clone や dup は浅い(shallow)コピーであることに注意してください。後述。

[EXCEPTION] TypeError:
TrueClass, FalseClass, NilClass, Symbol, そして Numeric クラスのインスタンスなど一部の オブジェクトを複製しようとすると発生します。
obj = "string"
obj.taint
def obj.fuga
end
obj.freeze

p(obj.equal?(obj))          #=> true
p(obj == obj)               #=> true
p(obj.tainted?)             #=> true
p(obj.frozen?)              #=> true
p(obj.respond_to?(:fuga))   #=> true

obj_c = obj.clone

p(obj.equal?(obj_c))        #=> false
p(obj == obj_c)             #=> true
p(obj_c.tainted?)           #=> true
p(obj_c.frozen?)            #=> true
p(obj_c.respond_to?(:fuga)) #=> true

obj_d = obj.dup

p(obj.equal?(obj_d))        #=> false
p(obj == obj_d)             #=> true
p(obj_d.tainted?)           #=> true
p(obj_d.frozen?)            #=> false
p(obj_d.respond_to?(:fuga)) #=> false

[SEE_ALSO] Object#initialize_copy

深いコピーと浅いコピー

clone や dup はオブジェクト自身を複製するだけで、オブジェクトの指し ている先(たとえば配列の要素など)までは複製しません。これを浅いコピー(shallow copy)といいます。

深い(deep)コピーが必要な場合には、 Marshalモジュールを利用して

Marshal.load(Marshal.dump(obj))

このように複製を作成する方法があります。ただしMarshal出来ないオブジェクトが 含まれている場合には使えません。

obj = ["a","b","c"]

obj_d = obj.dup
obj_d[0] << "PLUS"

p obj   #=> ["aPLUS", "b", "c"]
p obj_d #=> ["aPLUS", "b", "c"]

obj_m = Marshal.load(Marshal.dump(obj))
obj_m[1] << "PLUS"

p obj   #=> ["aPLUS", "b", "c"]
p obj_m #=> ["aPLUS", "bPLUS", "c"]
display(out = $stdout) -> nil

オブジェクトを out に出力します。

以下のように定義されています。

class Object
  def display(out = $stdout)
    out.print self.to_s
    nil
  end
end
[PARAM] out:
出力先のIOオブジェクトです。指定しない場合は標準出力に出力されます。
[RETURN]
nil を返します。
Object.new.display #=> #<Object:0xbb0210>

[SEE_ALSO] $stdout

dummy? -> bool

自身がダミーエンコーディングである場合に true を返します。 そうでない場合に false を返します。

ダミーエンコーディングとは Ruby が名前を知っているものの実質的には対応していないエンコーディングのことです。例えば、ダミーエンコーディングで符号化された文字列の場合、 String#length はマルチバイト文字を考慮せずにバイト列の長さを返します。

ダミーエンコーディングも IO の外部エンコーディングに指定できます。また Ruby はサポートしていないが拡張ライブラリがサポートしているエンコーディングを扱う場合にも 用います。

例:

Encoding::ISO_2022_JP.dummy?       #=> true
Encoding::UTF_8.dummy?             #=> false
to_enum(method = :each, *args) -> Enumerator
enum_for(method = :each, *args) -> Enumerator

Enumerator.new(self, method, *args) を返します。

[PARAM] method:
メソッド名の文字列かシンボルです。
[PARAM] args:
呼び出すメソッドに渡される引数です。
[EXCEPTION] NameError:
存在しないメソッド名を指定すると発生します。
str = "xyz"

enum = str.enum_for(:each_byte)
p(a = enum.map{|b| '%02x' % b }) #=> ["78", "79", "7a"]

# protects an array from being modified
a = [1, 2, 3]
p(a.to_enum) #=> #<Enumerator: [1, 2, 3]:each>

[SEE_ALSO] Enumerator

eql?(other) -> bool

オブジェクトと other が等しければ真を返します。Hash で二つのキー が等しいかどうかを判定するのに使われます。

このメソッドは各クラスの性質に合わせて再定義すべきです。 多くの場合、 == と同様に同値性の判定をするように再定義されていますが、 適切にキー判定ができるようにより厳しくなっている場合もあります。

デフォルトでは equal? と同じオブジェクト の同一性判定になっています。

このメソッドを再定義した時には Object#hash メソッ ドも再定義しなければなりません。

[PARAM] other:
比較するオブジェクトです。
p("foo".eql?("bar")) #=> false
p("foo".eql?("foo")) #=> true

p(4.eql?(4)) #=> true
p(4.eql?(4.0)) #=> false

[SEE_ALSO] Object#hash,Object#equal?,Object#==

equal?(other) -> bool

other が self 自身の時、真を返します。

二つのオブジェクトが同一のものかどうか調べる時に使用します。 このメソッドを再定義してはいけません。

お互いのObject#object_idが一致する かどうかを調べます。

[PARAM] other:
比較するオブジェクトです。
p("foo".equal?("bar")) #=> false
p("foo".equal?("foo")) #=> false

p(4.equal?(4)) #=> true
p(4.equal?(4.0)) #=> false

p(:foo.equal? :foo) #=> true

[SEE_ALSO] Object#object_id,Object#==,Object#eql?,Symbol

extend(*modules) -> self

引数で指定したモジュールのインスタンスメソッドを self の特異 メソッドとして追加します。

Module#include は、クラス(のインスタンス)に機能を追加します が、extend は、ある特定のオブジェクトだけにモジュールの機能を追加 したいときに使用します。

引数に複数のモジュールを指定した場合、最後 の引数から逆順に extend を行います。

[PARAM] modules:
モジュールを任意個指定します(クラスは不可)。
[RETURN]
self を返します。
module Foo
  def a
    'ok Foo'
  end
end

module Bar
  def b
    'ok Bar'
  end
end

obj = Object.new
obj.extend Foo, Bar
p obj.a #=> "ok Foo"
p obj.b #=> "ok Bar"

class Klass
  include Foo
  extend Bar
end

p Klass.new.a #=> "ok Foo"
p Klass.b     #=> "ok Bar"

extend の機能は、「特異クラスに対する Module#include」 と言い替えることもできます。 ただしその場合、フック用のメソッド が Module#extended ではなく Module#included になるという違いがあります。

# obj.extend Foo, Bar とほぼ同じ
class << obj
  include Foo, Bar
end

[SEE_ALSO] Module#extend_object,Module#include,Module#extended

freeze -> self

オブジェクトを凍結(内容の変更を禁止)します。

凍結されたオブジェクトの変更は 例外 RuntimeError を発生させます。 いったん凍結されたオブジェクトを元に戻す方法はありません。

凍結されるのはオブジェクトであり、変数ではありません。代入などで変数の指す オブジェクトが変化してしまうことは freeze では防げません。 freeze が防ぐのは、 `破壊的な操作' と呼ばれるもの一般です。変数への参照自体を凍結したい 場合は、グローバル変数なら Kernel.#trace_var が使えます。

[RETURN]
self を返します。
a1 = "foo".freeze
a1 = "bar"
p a1 #=> "bar"

a2 = "foo".freeze
a2.replace("bar")# can't modify frozen string (RuntimeError)

凍結を解除することはできませんが、Object#dup を使えばほぼ同じ内容の凍結されていない オブジェクトを得ることはできます。

a = [1].freeze
p a.frozen?     #=> true

a[0] = "foo"
p a             # can't modify frozen array (RuntimeError)

b = a.dup
p b             #=> [1]
p b.frozen?     #=> false

b[0] = "foo"
p b             #=> ["foo"]

[SEE_ALSO] Object#frozen?,Object#dup,Kernel.#trace_var

frozen? -> bool

オブジェクトが凍結(内容の変更を禁止)されているときに真を返します。

obj = "someone"
p obj.frozen? #=> false
obj.freeze
p obj.frozen? #=> true

[SEE_ALSO] Object#freeze

hash -> Fixnum

オブジェクトのハッシュ値を返します。Hash クラスでオブジェク トを格納するのに用いられています。

メソッド hash は Object#eql? と組み合わせて Hash クラスで利用されます。その際

A.eql?(B) ならば A.hash == B.hash

の関係を必ず満たしていなければいけません。eql? を再定義した時には必ずこちらも合わせ て再定義してください。

デフォルトでは、Object#object_id と同じ値を返します。 ただし、Fixnum, Symbol, String だけは組込みのハッ シュ関数が使用されます(これを変えることはできません)。

hash を再定義する場合は、一様に分布する任意の整数を返すようにします。

[RETURN]
ハッシュ値を返します。Fixnumに収まらない場合は切り捨てられます。
p self.hash #=> 21658870
p 0.hash #=> 1
p 0.0.hash #=> 0
p nil.hash #=> 4

p "ruby".hash #=> -241670986
p "ruby".hash #=> -241670986
p :ruby.hash #=> 103538
p :ruby.hash #=> 103538

[SEE_ALSO] Object#eql?,BasicObject#__id__

inspect -> String

プログラマにわかりやすい表現の文字列を返します。

例:

Encoding::UTF_8.inspect       #=> "#<Encoding:UTF-8>"
Encoding::ISO_2022_JP.inspect #=> "#<Encoding:ISO-2022-JP (dummy)>"
inspect -> String

オブジェクトを人間が読める形式に変換した文字列を返します。

組み込み関数 Kernel.#p は、このメソッドの結果を使用して オブジェクトを表示します。

puts Class.new.inspect #=> #<Class:0xbafd88>
puts Time.now.inspect #=> 2007-10-15 21:01:37 +0900

[SEE_ALSO] Kernel.#p

instance_of?(klass) -> bool

オブジェクトがクラス klass の直接のインスタンスである時真を返します。

obj.instance_of?(c) が成立する時には、常に obj.kind_of?(c) も成立します。

[PARAM] klass:
Classかそのサブクラスのインスタンスです。
class C < Object
end
class S < C
end

obj = S.new
p obj.instance_of?(S)       # true
p obj.instance_of?(C)       # false

[SEE_ALSO] Object#kind_of?,Object#class

instance_variable_defined?(var) -> bool

インスタンス変数 var が定義されていたら真を返します。

[PARAM] var:
インスタンス変数名を文字列か Symbol で指定します。
class Fred
  def initialize(p1, p2)
    @a, @b = p1, p2
  end
end
fred = Fred.new('cat', 99)
p fred.instance_variable_defined?(:@a)    #=> true
p fred.instance_variable_defined?("@b")   #=> true
p fred.instance_variable_defined?("@c")   #=> false

[SEE_ALSO] Object#instance_variable_get,Object#instance_variable_set,Object#instance_variables

instance_variable_get(var) -> object|nil

オブジェクトのインスタンス変数の値を取得して返します。

インスタンス変数が定義されていなければ nil を返します。

[PARAM] var:
インスタンス変数名を文字列か Symbol で指定します。
class Foo
  def initialize
    @foo = 1
  end
end

obj = Foo.new
p obj.instance_variable_get("@foo")     #=> 1
p obj.instance_variable_get(:@foo)      #=> 1
p obj.instance_variable_get(:@bar)      #=> nil

[SEE_ALSO] Object#instance_variable_set,Object#instance_variables,Object#instance_variable_defined?

instance_variable_set(var, value) -> object

オブジェクトのインスタンス変数 var に値 value を設定します。

インスタンス変数が定義されていなければ新たに定義されます。

[PARAM] var:
インスタンス変数名を文字列か Symbol で指定します。
[PARAM] value:
設定する値です。
[RETURN]
value を返します。
obj = Object.new
p obj.instance_variable_set("@foo", 1)  #=> 1
p obj.instance_variable_set(:@foo, 2)   #=> 2
p obj.instance_variable_get(:@foo)      #=> 2

[SEE_ALSO] Object#instance_variable_get,Object#instance_variables,Object#instance_variable_defined?

instance_variables -> [Symbol]

オブジェクトのインスタンス変数名をシンボルの配列として返します。

obj = Object.new
obj.instance_eval { @foo, @bar = nil }
p obj.instance_variables

#=> [:@foo, :@bar]

[SEE_ALSO] Object#instance_variable_get,Kernel.#local_variables,Kernel.#global_variables,Module.constants,Module#constants,Module#class_variables

is_a?(mod) -> bool
kind_of?(mod) -> bool

オブジェクトが指定されたクラス mod かそのサブクラスのインスタンスであるとき真を返します。

また、オブジェクトがモジュール mod をインクルードしたクラスかそのサブクラス のインスタンスである場合にも真を返します。 上記のいずれでもない場合に false を返します。

[PARAM] mod:
クラスやモジュールなど、Moduleかそのサブクラスのインスタンスです。
module M
end
class C < Object
  include M
end
class S < C
end

obj = S.new
p obj.is_a?(S)       # true
p obj.is_a?(C)       # true
p obj.is_a?(Object)  # true
p obj.is_a?(M)       # true
p obj.is_a?(Hash)    # false

[SEE_ALSO] Object#instance_of?,Module#===,Object#class

marshal_dump -> object

Marshal.#dump を制御するメソッドです。

Marshal.dump(some) において、出力するオブジェクト some がメソッド marshal_dump を 持つ場合には、その返り値がダンプされたものが Marshal.dump(some) の返り値となります。

marshal_dump/marshal_load の仕組みは Ruby 1.8.0 から導入されました。 これから書くプログラムでは _dump/_load ではなく marshal_dump/marshal_load を使うべきです。

[RETURN]
任意のオブジェクトで marshal_load の引数に利用できます。
class Foo
  def initialize(arg)
    @foo = arg
  end
  def marshal_dump
    @foo
  end
  def marshal_load(obj)
    p obj
    @foo = obj
  end
end
foo = Foo.new(['foo', 'bar'])
p foo                      #=> #<Foo:0xbaf3b0 @foo=["foo", "bar"]>
dms = Marshal.dump(foo)
p dms                      #=> "\004\bU:\bFoo[\a\"\bfoo\"\bbar"
result = Marshal.load(dms) #=> ["foo", "bar"] # marshal_load の引数
p result                   #=> #<Foo:0xbaf2ac @foo=["foo", "bar"]>

インスタンス変数の情報は普通マーシャルデータに含まれるので、 上例のように marshal_dump を定義する必要はありません (ただし marshal_dump を定義するとインスタンス変数の情報は ダンプされなくなるので、marshal_dump/marshal_load で扱う必要があります)。 marshal_dump/marshal_load はより高度な制御を行いたい場合や 拡張ライブラリで定義したクラスのインスタンスがインスタンス変数以外 に情報を保持する場合に利用します。

特に、marshal_dump/marshal_load を定義したオブジェクトは 特異メソッドが定義されていてもマーシャルできるようになります (特異メソッドの情報が自動的に dump されるようになるわけではなく、 marshal_dump/marshal_load によりそれを実現する余地があるということです)。

[SEE_ALSO] Object#marshal_load, Marshal

marshal_load(obj) -> object

Marshal.#load を制御するメソッドです。

some のダンプ結果(Marshal.dump(some)) をロードする(Marshal.load(Marshal.dump(some)))に は some がメソッド marshal_load を持っていなければなりません。 このとき、marshal_dump の返り値が marshal_load の引数に利用されます。 marshal_load 時の self は、生成されたばかり(Class#allocate されたばかり) の状態です。

marshal_dump/marshal_load の仕組みは Ruby 1.8.0 から導入されました。 これから書くプログラムでは _dump/_load ではなく marshal_dump/marshal_load を使うべきです。

[PARAM] obj:
marshal_dump の返り値のコピーです。
[RETURN]
返り値は無視されます。

[SEE_ALSO] Object#marshal_dump, Marshal

method(name) -> Method

オブジェクトのメソッド name をオブジェクト化した Method オブジェクトを返します。

[PARAM] name:
メソッド名をSymbol またはStringで指定します。
[EXCEPTION] NameError:
定義されていないメソッド名を引数として与えると発生します。
me = -365.method(:abs)
p me #=> #<Method: Fixnum#abs>
p me.call #=> 365

[SEE_ALSO] Module#instance_method,Method,Object#__send__,Kernel.#eval

methods(include_inherited = true) -> [Symbol]

そのオブジェクトに対して呼び出せるメソッド名の一覧を返します。 このメソッドは public メソッドおよび protected メソッドの名前を返します。

ただし特別に、引数が偽の時は Object#singleton_methods(false) と同じになっています。

[PARAM] include_inherited:
引数が偽の時は Object#singleton_methods(false) と同じになります。
#例1:

class Parent
  private;   def private_parent()   end
  protected; def protected_parent() end
  public;    def public_parent()    end
end

class Foo < Parent
  private;   def private_foo()   end
  protected; def protected_foo() end
  public;    def public_foo()    end
end

obj = Foo.new
class <<obj
    private;   def private_singleton()   end
    protected; def protected_singleton() end
    public;    def public_singleton()    end
end

# あるオブジェクトの応答できるメソッドの一覧を得る。
p obj.methods(false)
p obj.public_methods(false)
p obj.private_methods(false)
p obj.protected_methods(false)

#実行結果

[:protected_singleton, :public_singleton]
[:public_singleton, :public_foo]
[:private_singleton, :private_foo]
[:protected_singleton, :protected_foo]

#例2:

# あるオブジェクトの応答できるメソッドの一覧を得る。
# 自身のクラスの親クラスのインスタンスメソッドも含めるために true を指定して
# いるが、Object のインスタンスメソッドは一覧から排除している。
p obj.methods(true)           - Object.instance_methods(true)
p obj.public_methods(true)    - Object.public_instance_methods(true)
p obj.private_methods(true)   - Object.private_instance_methods(true)
p obj.protected_methods(true) - Object.protected_instance_methods(true)

#実行結果

[:protected_singleton, :public_singleton, :protected_foo, :public_foo, :protected_parent, :public_parent]
[:public_singleton, :public_foo, :public_parent]
[:private_singleton, :private_foo, :private_parent]
[:protected_singleton, :protected_foo, :protected_parent]

[SEE_ALSO] Module#instance_methods,Object#singleton_methods

name -> String
to_s -> String

エンコーディングの名前を返します。

Encoding::UTF_8.name       => "UTF-8"
names -> String

エンコーディングの名前とエイリアス名の配列を返します。

Encoding::UTF_8.names      => ["UTF-8", "CP65001"]
nil? -> bool

レシーバが nil であれば真を返します。

p false.nil? #=> false
p nil.nil? #=> true

[SEE_ALSO] NilClass

object_id -> Integer

各オブジェクトに対して一意な整数を返します。あるオブジェクトに対し てどのような整数が割り当てられるかは不定です。

Rubyでは、(Garbage Collectされていない)アクティブなオブジェクト間で 重複しない整数(object_id)が各オブジェクトにひとつずつ割り当てられています。この メソッドはその値を返します。

TrueClass, FalseClass, NilClass, Symbol, Fixnum クラス のインスタンスなど Immutable(変更不可)なオブジェクトの一部は同じ内容ならば必ず同じ object_id になります。

これは、Immutable ならば複数の場所から参照されても`破壊的操作'による問題が発生しないので、 同じ内容のインスタンスを複数生成しないという内部実装が理由です。

p "ruby".object_id #=> 22759500
p "ruby".object_id #=> 22759400

p [].object_id #=> 22759360
p [].object_id #=> 22759340

p :ruby.object_id #=> 103538
p :ruby.object_id #=> 103538

p 11.object_id #=> 23
p 11.object_id #=> 23

p true.object_id #=> 2
p true.object_id #=> 2

[SEE_ALSO] Object#equal?,Symbol

private_methods(include_inherited = true) -> [Symbol]

そのオブジェクトが理解できる private メソッド名の一覧を返します。

[PARAM] include_inherited:
偽となる値を指定すると自身のクラスのスーパークラスで定義されたメソッドを除きます。

[SEE_ALSO] Module#private_instance_methods,Object#methods,Object#singleton_methods

protected_methods(include_inherited = true) -> [Symbol]

そのオブジェクトが理解できる protected メソッド名の一覧を返します。

[PARAM] include_inherited:
偽となる値を指定すると自身のクラスのスーパークラスで定義されたメソッドを除きます。

[SEE_ALSO] Module#protected_instance_methods,Object#methods,Object#singleton_methods

public_methods(include_inherited = true) -> [Symbol]

そのオブジェクトが理解できる public メソッド名の一覧を返します。

[PARAM] include_inherited:
偽となる値を指定すると自身のクラスのスーパークラスで定義されたメソッドを除きます。

[SEE_ALSO] Module#public_instance_methods,Object#methods,Object#singleton_methods

public_send(name, *args) -> object

オブジェクトの public メソッド name を args を引数にして呼び出し、メソッ ドの実行結果を返します。

1.public_send(:+, 2)  # => 3
[PARAM] name:
文字列かSymbol で指定するメソッド名です。
[PARAM] args:
呼び出すメソッドに渡す引数です。
[EXCEPTION] ArgumentError:
name を指定しなかった場合に発生します。
[EXCEPTION] NoMethodError:
protected メソッドや private メソッドに対して実行 した場合に発生します。
1.public_send(:puts, "hello")  # => NoMethodError

[SEE_ALSO] Object#send

replicate(name) -> Encoding

レシーバのエンコーディングを複製(replicate)します。 複製されたエンコーディングは元のエンコーディングと同じバイト構造を持たなければなりません。 name という名前のエンコーディングが既に存在する場合は ArgumentError を発生します。

respond_to?(name, include_private = false) -> bool

オブジェクトがメソッド name を持つとき真を返します。

オブジェクトが メソッド name を持つというのは、 オブジェクトが メソッド name に応答することができることをいいます。

[PARAM] name:
Symbol または文字列で指定するメソッド名です。
[PARAM] include_private:
private メソッドを確認の対象に含めるかを true か false で指定します。省略した場合は false(含めな い) を指定した事になります。
class F
  def hello
    "Bonjour"
  end
end

class D
private
  def hello
    "Guten Tag"
  end
end
list = [F.new,D.new]

list.each{|it| puts it.hello if it.respond_to?(:hello)}
#=> Bonjour

list.each{|it| it.instance_eval("puts hello if it.respond_to?(:hello, true)")}
#=> Bonjour
#   Guten Tag

[SEE_ALSO] Module#method_defined?

respond_to_missing?(symbol, include_private) -> bool

自身が symbol で表されるメソッドに対し BasicObject#method_missing で反応するつもりならば真を返します。

Object#respond_to? はメソッドが定義されていない場合、 デフォルトでこのメソッドを呼びだし問合せます。

BasicObject#method_missing を override した場合にこのメソッドも override されるべきです。

false を返します。

[PARAM] symbol:
メソッド名シンボル
[PARAM] include_private:
private method も含めたい場合に true が渡されます

[SEE_ALSO] Object#respond_to?, BasicObject#method_missing

singleton_class -> Class

レシーバの特異クラスを返します。 まだ特異クラスがなければ、新しく作成します。

レシーバが nil か true か false なら、それぞれ NilClass, TrueClass, FalseClass を返します。

[EXCEPTION] TypeError:
レシーバが Fixnum か Symbol の場合に発生します。
Object.new.singleton_class  #=> #<Class:#<Object:0xb7ce1e24>>
String.singleton_class      #=> #<Class:String>
nil.singleton_class         #=> NilClass

[SEE_ALSO] Object#class

singleton_methods(inherited_too = true) -> [Symbol]

そのオブジェクトに対して定義されている特異メソッド名 (public あるいは protected メソッド) の一覧を返します。

クラスメソッド(Classのインスタンスの特異メソッド)に関しては 引数が真のとき、スーパークラスのクラスメソッドも対象になります。

singleton_methods(false) は、Object#methods(false) と同じです。

[PARAM] inherited_too:
引数が真のとき、スーパークラスのクラスメソッドも対象になります。これが意味を持つのは self がクラスオブジェクトであるときだけです。
#例1:

Parent = Class.new

class <<Parent
  private;   def private_class_parent() end
  protected; def protected_class_parent() end
  public;    def public_class_parent() end
end

Foo = Class.new(Parent)

class <<Foo
  private;   def private_class_foo() end
  protected; def protected_class_foo() end
  public;    def public_class_foo() end
end

module Bar
  private;   def private_bar()   end
  protected; def protected_bar() end
  public;    def public_bar()    end
end

obj = Foo.new
class <<obj
  include Bar
  private;   def private_self()   end
  protected; def protected_self() end
  public;    def public_self()    end
end

# あるオブジェクトの特異メソッドの一覧を得る。
p obj.singleton_methods(false)
p obj.methods(false)
p Foo.singleton_methods(false)

#実行結果

[:protected_self, :public_self]
[:protected_self, :public_self]
[:protected_class_foo, :public_class_foo]


#例2:

# あるオブジェクトの特異メソッドの一覧を得る。
# 親クラスのクラスメソッドも含まれるよう true を指定したが、
# Object のクラスメソッドは一覧から排除している。

p obj.singleton_methods(true)
p Foo.singleton_methods(true) - Object.singleton_methods(true)

#実行結果

[:protected_self, :public_self, :protected_bar, :public_bar]
[:protected_class_foo, :public_class_foo, :protected_class_parent, :public_class_parent]

[SEE_ALSO] Object#methods,Object#extend

taint -> self

オブジェクトの「汚染マーク」をセットします。

環境変数(ENVで得られる文字列)など一部のオブジェクトは最初から汚染されています。 オブジェクトの汚染に関してはセキュリティモデルを参照してください。

$SAFE = 1

some = "puts '@&%&(#!'"
p some.tainted? #=> false
eval(some) #=> @&%&(#!

some.taint
p some.tainted? #=> true
eval(some) # Insecure operation - eval (SecurityError)

some.untaint
p some.tainted? #=> false
eval(some) #=> @&%&(#!

p ENV['OS'].tainted? #=> true

[SEE_ALSO] Object#tainted?,Object#untaint,Object#freeze

tainted? -> bool

オブジェクトの「汚染マーク」がセットされている時真を返します。

オブジェクトの汚染に関してはセキュリティモデルを参照してください。

p String.new.tainted? #=> false
p ENV['OS'].tainted? #=> true

[SEE_ALSO] Object#taint,Object#untaint

tap {|x| ... } -> self

self を引数としてブロックを評価し、self を返します。

メソッドチェインの途中で直ちに操作結果を表示するために メソッドチェインに "入り込む" ことが、このメソッドの主目的です。

(1..10)                    .tap {|x| puts "original: #{x.inspect}"}.
   to_a                    .tap {|x| puts "array: #{x.inspect}"}.
   select {|x| x % 2 == 0} .tap {|x| puts "evens: #{x.inspect}"}.
   map { |x| x * x }       .tap {|x| puts "squares: #{x.inspect}"}
to_a -> Array

オブジェクトを配列に変換した結果を返します。 デフォルトでは定義されていません。

説明のためここに記載してありますが、 このメソッドは実際には Object クラスには定義されていません。 必要に応じてサブクラスで定義すべきものです。

p( {'a'=>1}.to_a )  # [["a", 1]]
p ['array'].to_a    # ["array"]
p nil.to_a          # []

[SEE_ALSO] Object#to_ary,Kernel.#Array

to_ary -> Array

オブジェクトの Array への暗黙の変換が必要なときに内部で呼ばれます。 デフォルトでは定義されていません。

説明のためここに記載してありますが、 このメソッドは実際には Object クラスには定義されていません。 必要に応じてサブクラスで定義すべきものです。

このメソッドを定義する条件は、

  • 配列が使われるすべての場面で代置可能であるような、
  • 配列そのものとみなせるようなもの

という厳しいものになっています。

class Foo
 def to_ary
   [3,4]
 end
end

it = Foo.new
p([1,2] + it) #=> [1, 2, 3, 4]

[SEE_ALSO] Object#to_a,Kernel.#Array

to_hash -> Hash

オブジェクトの Hash への暗黙の変換が必要なときに内部で呼ばれます。 デフォルトでは定義されていません。

説明のためここに記載してありますが、 このメソッドは実際には Object クラスには定義されていません。 必要に応じてサブクラスで定義すべきものです。

このメソッドを定義する条件は、

  • ハッシュが使われるすべての場面で代置可能であるような、
  • ハッシュそのものとみなせるようなもの

という厳しいものになっています。

class Foo
 def to_hash
   {'as' => 24}
 end
end

it = Foo.new
p({:as => 12}.merge(it)) #=> {"as"=>24, :as=>12}
to_int -> Integer

オブジェクトの Integer への暗黙の変換が必要なときに内部で呼ばれます。 デフォルトでは定義されていません。

説明のためここに記載してありますが、 このメソッドは実際には Object クラスには定義されていません。 必要に応じてサブクラスで定義すべきものです。

このメソッドを定義する条件は、

  • 整数が使われるすべての場面で代置可能であるような、
  • 整数そのものとみなせるようなもの

という厳しいものになっています。

class Foo
 def to_int
   666
 end
end

it = Foo.new
p(9**9 & it) #=> 8

[SEE_ALSO] Kernel.#Integer

to_io -> IO

オブジェクトの IO への暗黙の変換が必要なときに内部で呼ばれます。 デフォルトでは定義されていません。

説明のためここに記載してありますが、 このメソッドは実際には Object クラスには定義されていません。 必要に応じてサブクラスで定義すべきものです。

このメソッドを定義する条件は、

  • IOオブジェクトが使われるすべての場面で代置可能であるような、
  • IOオブジェクトそのものとみなせるようなもの

という厳しいものになっています。

to_proc -> Proc

オブジェクトの Proc への暗黙の変換が必要なときに内部で呼ばれます。 デフォルトでは定義されていません。

説明のためここに記載してありますが、 このメソッドは実際には Object クラスには定義されていません。 必要に応じてサブクラスで定義すべきものです。

def doing
  yield
end

class Foo
 def to_proc
   Proc.new{p 'ok'}
 end
end

it = Foo.new
doing(&it) #=> "ok"
to_regexp -> Regexp

オブジェクトの Regexp への暗黙の変換が必要なときに内部で呼ばれます。 デフォルトでは定義されていません。

説明のためここに記載してありますが、 このメソッドは実際には Object クラスには定義されていません。 必要に応じてサブクラスで定義すべきものです。

このメソッドを定義する条件は、

  • 正規表現が使われるすべての場面で代置可能であるような、
  • 正規表現そのものとみなせるようなもの

という厳しいものになっています。

class Foo
 def to_regexp
   /[\d]+/
 end
end

it = Foo.new
p Regexp.union(/^at/, it) #=> /(?-mix:^at)|(?-mix:[\d]+)/
to_s -> String

オブジェクトの文字列表現を返します。

Kernel.#printKernel.#sprintf は文字列以外の オブジェクトが引数に渡された場合このメソッドを使って文字列に変換し ます。

class Foo
  def initialize num
    @num = num
  end
end
it = Foo.new(40)

puts it #=> #<Foo:0x2b69110>

class Foo
 def to_s
   "Class:Foo Number:#{@num}"
 end
end

puts it #=> Class:Foo Number:40

[SEE_ALSO] Object#to_str,Kernel.#String

to_str -> String

オブジェクトの String への暗黙の変換が必要なときに内部で呼ばれます。 デフォルトでは定義されていません。

説明のためここに記載してありますが、 このメソッドは実際には Object クラスには定義されていません。 必要に応じてサブクラスで定義すべきものです。

このメソッドを定義する条件は、

  • 文字列が使われるすべての場面で代置可能であるような、
  • 文字列そのものとみなせるようなもの

という厳しいものになっています。

class Foo
 def to_str
   'Edition'
 end
end

it = Foo.new
p('Second' + it) #=> "SecondEdition"

[SEE_ALSO] Object#to_s,Kernel.#String

trust -> self

[TODO]

オブジェクトの「untrustマーク」を取り除きます。

[SEE_ALSO] Object#untrusted?,Object#untrust

untaint -> self

オブジェクトの「汚染マーク」を取り除きます。

汚染マークを取り除くことによる危険性はプログラマが責任を負う必要が あります。

オブジェクトの汚染に関してはセキュリティモデルを参照してください。

[EXCEPTION] SecurityError:
セキュリティレベルが3以上の時にこのメソッドを使用すると発生します。

[SEE_ALSO] Object#taint,Object#tainted?

untrust -> self

[TODO]

オブジェクトの「untrustマーク」をセットします。

[SEE_ALSO] Object#trust,Object#untrusted?

untrusted? -> bool

[TODO]

オブジェクトの「untrustマーク」がセットされている時真を返します。

[SEE_ALSO] Object#trust,Object#untrust

privateメソッド

initialize(*args, &block) -> object

ユーザ定義クラスのオブジェクト初期化メソッド。

このメソッドは Class#new から新しく生成されたオブ ジェクトの初期化のために呼び出されます。他の言語のコンストラクタに相当します。 デフォルトの動作ではなにもしません。

initialize には Class#new に与えられた引数がそのまま渡されます。

サブクラスではこのメソッドを必要に応じて再定義されること が期待されています。

initialize という名前のメソッドは自動的に private に設定され ます。

[PARAM] args:
初期化時の引数です。
[PARAM] block:
初期化時のブロック引数です。必須ではありません。
class Foo
  def initialize name
    puts "initialize Foo"
    @name = name
  end
end

class Bar < Foo
  def initialize name, pass
    puts "initialize Bar"
    super name
    @pass = pass
  end
end

it = Bar.new('myname','0500')
p it
#=> initialize Bar
#   initialize Foo
#   #<Bar:0x2b68f08 @name="myname", @pass="0500">

[SEE_ALSO] Class#new

initialize_copy(obj) -> object

(拡張ライブラリによる) ユーザ定義クラスのオブジェクトコピーの初期化メソッド。

このメソッドは self を obj の内容で置き換えます。ただ し、self のインスタンス変数や特異メソッドは変化しません。 Object#clone, Object#dupの内部で使われています。

initialize_copy は、Ruby インタプリタが知り得ない情報をコピーするた めに使用(定義)されます。例えば C 言語でクラスを実装する場合、情報 をインスタンス変数に保持させない場合がありますが、そういった内部情 報を initialize_copy でコピーするよう定義しておくことで、dup や clone を再定義する必要がなくなります。

デフォルトの Object#initialize_copy は、 freeze チェックおよび型のチェックを行い self を返すだけのメソッドです。

initialize_copy という名前のメソッドは 自動的に private に設定されます。

[EXCEPTION] TypeError:
レシーバが freeze されているか、obj のクラスがレシーバ のクラスと異なる場合に発生します。

[SEE_ALSO] Object#clone,Object#dup

以下に例として、dup や clone がこのメソッドをどのように利用しているかを示します。

obj.dup は、新たに生成したオブジェクトに対して initialize_copy を呼び

obj2 = obj.class.allocate
obj2.initialize_copy(obj)

obj2 に対してさらに obj の汚染状態、インスタンス変数、ファイナライ ザをコピーすることで複製を作ります。 obj.clone は、さらに 特異メソッドのコピーも行います。

obj = Object.new
class <<obj
  attr_accessor :foo
  def bar
    :bar
  end
end

def check(obj)
  puts "instance variables: #{obj.inspect}"
  puts "tainted?: #{obj.tainted?}"
  print "singleton methods: "
  begin
    p obj.bar
  rescue NameError
    p $!
  end
end

obj.foo = 1
obj.taint

check Object.new.send(:initialize_copy, obj)
        #=> instance variables: #<Object:0x4019c9d4>
        #   tainted?: false
        #   singleton methods: #<NoMethodError: ...>
check obj.dup
        #=> instance variables: #<Object:0x4019c9c0 @foo=1>
        #   tainted?: true
        #   singleton methods: #<NoMethodError: ...>
check obj.clone
        #=> instance variables: #<Object:0x4019c880 @foo=1>
        #   tainted?: true
        #   singleton methods: :bar
remove_instance_variable(name) -> object

オブジェクトからインスタンス変数 name を取り除き、そのインス タンス変数に設定されていた値を返します。

[PARAM] name:
削除するインスタンス変数の名前をシンボルか文字列で指定します。
[EXCEPTION] NameError:
オブジェクトがインスタンス変数 name を持たない場合に発生します。
class Foo
  def foo
    @foo = 1
    p remove_instance_variable(:@foo) #=> 1
    p remove_instance_variable(:@foo) # instance variable @foo not defined (NameError)
  end
end
Foo.new.foo

[SEE_ALSO] Module#remove_class_variable,Module#remove_const

定数

US_ASCII -> Encoding
ASCII -> Encoding
ANSI_X3_4_1968 -> Encoding

US-ASCII、いわゆる ASCII のことで、ISO 646 IRV と一致します。

7bit の範囲のみを含み、8bit 目の立っている文字 (たとえば \x80 など) が含まれる場合は正しいエンコーディングであるとみなしません。

ASCII_8BIT -> Encoding
BINARY -> Encoding

ASCII-8BIT、ASCII互換オクテット列用のエンコーディングです。

もっぱら文字エンコーディングを持たないデータ、文字を符号化したのではない単なるバイトの列を表現するために用いますが、このエンコーディングは ASCII 互換であることがポイントです。

Big5 -> Encoding
BIG5 -> Encoding

Big5 エンコーディングです。

台湾で使われている繁体字中国語のエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Big5

Big5_HKSCS -> Encoding
BIG5_HKSCS -> Encoding
BIG5_HKSCS_2008 -> Encoding
Big5_HKSCS_2008 -> Encoding

Big5-HKSCS エンコーディングです。

香港で使われている Big5 の亜種です。

[SEE_ALSO] http://www.iana.org/assignments/charset-reg/Big5-HKSCS, http://www.ogcio.gov.hk/ccli/eng/hkscs/mapping_table_2008.html

BIG5_UAO -> Encoding
Big5_UAO -> Encoding

Big5_UAO エンコーディングです。

Big5 の亜種(非公式的拡張)です。

Unicodeとの対応表が http://moztw.org/docs/big5/table/big5_2003-b2u.txt にあります。

Windows_1250 -> Encoding
CP1250 -> Encoding
WINDOWS_1250 -> Encoding

Windows-1250 エンコーディング。

ISO8859-2 の亜種です。

[SEE_ALSO] http://www.microsoft.com/globaldev/reference/sbcs/1250.mspx, http://en.wikipedia.org/wiki/Windows-1250

Windows_1251 -> Encoding
CP1251 -> Encoding
WINDOWS_1251 -> Encoding

Windows-1251 エンコーディング。

キリル文字を用いる言語を取り扱う8bit single-byteエンコーディングです。

[SEE_ALSO] http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1251.mspx, http://en.wikipedia.org/wiki/Windows-1251

Windows_1252 -> Encoding
CP1252 -> Encoding
WINDOWS_1252 -> Encoding

Windows-1252 エンコーディングです。

ISO8859-1 の亜種です。

[SEE_ALSO] Encoding::ISO_8859_1 http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1252.mspx, http://en.wikipedia.org/wiki/Windows-1252

Windows_1253 -> Encoding
CP1253 -> Encoding
WINDOWS_1253 -> Encoding

Windows-1253 エンコーディング。

ISO8859-7 の亜種です。

[SEE_ALSO] Encoding::ISO_8859_7, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1253.mspx, http://en.wikipedia.org/wiki/Windows-1253

Windows_1254 -> Encoding
CP1254 -> Encoding
WINDOWS_1254 -> Encoding

Windows-1254 エンコーディング。

ISO8859-9 の亜種です。

[SEE_ALSO] Encoding::ISO_8859_9, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1254.mspx, http://en.wikipedia.org/wiki/Windows-1254

Windows_1255 -> Encoding
CP1255 -> Encoding
WINDOWS_1255 -> Encoding

Windows-1255 エンコーディング。

ISO8859-8 の亜種です。

[SEE_ALSO] Encoding::ISO_8859_8, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1255.mspx, http://en.wikipedia.org/wiki/Windows-1255,

Windows_1256 -> Encoding
CP1256 -> Encoding
WINDOWS_1256 -> Encoding

Windows-1256 エンコーディング。

Windowsで用いられる、アラビア文字を扱う 8bit single-byte エンコーディングです。

[SEE_ALSO] Encoding::ISO_8859_6, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1256.mspx, http://en.wikipedia.org/wiki/Windows-1256

Windows_1257 -> Encoding
CP1257 -> Encoding
WINDOWS_1257 -> Encoding

Windows-1257 エンコーディング。

ISO8859-13 の亜種です。

[SEE_ALSO] Encoding::ISO8859_13, http://www.iana.org/assignments/character-sets, http://www.microsoft.com/globaldev/reference/sbcs/1257.mspx, http://en.wikipedia.org/wiki/Windows-1257,

Windows_1258 -> Encoding
CP1258 -> Encoding
WINDOWS_1258 -> Encoding

WINDOWS-1258 エンコーディング。

ベトナム語を扱う 8bit single-byteエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Windows-1258

IBM437 -> Encoding
CP437 -> Encoding

CP437 エンコーディング。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_437, Encoding::CP869

CP50220 -> Encoding

CP50220 エンコーディング、 Windows で用いられる ISO-2022-JP 亜種です。

CP50221 とほぼ同様のエンコーディングですが、 他のエンコーディングへの変換テーブルが少し異なります。

[SEE_ALSO] http://legacy-encoding.sourceforge.jp/wiki/index.php?cp50220

CP50221 -> Encoding

Windows で用いられる、ISO-2022-JP 亜種です。

ISO-2022-JP に加え、ESC ( I でいわゆる半角カナを許し、Windows の機種依存文字を扱うことができます。

[SEE_ALSO] http://legacy-encoding.sourceforge.jp/wiki/index.php?cp50221

CP51932 -> Encoding

Windows で用いられる、日本語 EUC 亜種です。

G0 が US-ASCII、G1 が JIS X 0201 片仮名図形文字集合、G2 が JIS X 0208 + Windows の機種依存文字となっており、G3 は未割り当てになっています。

[SEE_ALSO] http://legacy-encoding.sourceforge.jp/wiki/index.php?cp51932

UTF_7 -> Encoding
CP65000 -> Encoding

UTF-7 です。

7ビットの範囲内で表現される、Unicode のエンコーディングの一種です。 ダミーエンコーディングです。

UTF_8 -> Encoding
CP65001 -> Encoding

UTF-8、Unicode や ISO 10646 を ASCII 互換な形で符号化するための方式です。

BOM を含みません。

[SEE_ALSO] http://tools.ietf.org/html/rfc3629

IBM737 -> Encoding
CP737 -> Encoding

CP437 エンコーディング。

ギリシャ語を取り扱う 8bit single-byteエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_737

IBM775 -> Encoding
CP775 -> Encoding

CP775 エンコーディング。

バルト語派の言語を扱うための 8bit single-byteエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_775

CP850 -> Encoding
IBM850 -> Encoding

CP850 エンコーディング。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_850

IBM852 -> Encoding
CP852 -> Encoding

CP852 エンコーディング。

ラテンアルファベットを用いる中欧の言語のための 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_852

IBM855 -> Encoding
CP855 -> Encoding

CP855 エンコーディング。

キリル文字を用いる言語のための 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_855

IBM857 -> Encoding
CP857 -> Encoding

CP857 エンコーディング。

トルコ語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_857

IBM860 -> Encoding
CP860 -> Encoding

CP860 エンコーディング。

ポルトガル語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_860

IBM861 -> Encoding
CP861 -> Encoding

CP861 エンコーディング。

アイスランド語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_861

IBM862 -> Encoding
CP862 -> Encoding

CP862 エンコーディング。

ヘブライ語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_861

IBM863 -> Encoding
CP863 -> Encoding

CP863 エンコーディング。

フランス語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_863

IBM864 -> Encoding
CP864 -> Encoding

CP864 エンコーディング。

アラビア語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_864

IBM865 -> Encoding
CP865 -> Encoding

CP865 エンコーディング。

北欧の諸言語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_865

IBM866 -> Encoding
CP866 -> Encoding

CP866 エンコーディング。

キリル文字を使う諸言語に用いられる、 8bit single-byte エンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_866

IBM869 -> Encoding
CP869 -> Encoding

CP869 エンコーディング。

ギリシャ語を取り扱う 8bit single-byteエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Code_page_869, Encoding::CP737

Windows_874 -> Encoding
CP874 -> Encoding
WINDOWS_874 -> Encoding

Windows-874 エンコーディング。

タイ語を扱うエンコーディングで、ISO8859-11の亜種です。

[SEE_ALSO] Encoding::TIS_620, Encoding::ISO_8859_11, http://www.microsoft.com/globaldev/reference/sbcs/874.mspx

KOI8_R -> Encoding
CP878 -> Encoding

KOI8-R エンコーディング。

ロシア語のキリル文字で使われる8bit single-byteエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/KOI8-R

Windows_31J -> Encoding
CP932 -> Encoding
CSWINDOWS31J -> Encoding
CsWindows31J -> Encoding
WINDOWS_31J -> Encoding
PCK -> Encoding

Windows-31J、Windows で用いられる、シフトJIS亜種で、CP932とも言います。

7bit 部分が論理的には US-ASCIIであり、また Windows の機種依存文字を扱うことができます。

[SEE_ALSO] http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/index.html, http://legacy-encoding.sourceforge.jp/wiki/index.php?cp932

GBK -> Encoding
CP936 -> Encoding

GBK エンコーディング

中国で用いられる簡体字中国語のエンコーディングです。

[SEE_ALSO] http://www.iana.org/assignments/character-sets, http://www.iana.org/assignments/charset-reg/GBK, http://www.microsoft.com/globaldev/reference/dbcs/936.mspx

CP949 -> Encoding

CP949 エンコーディング。

EUC-KR に近い、韓国語を取り扱う multi-byte エンコーディングです。

[SEE_ALSO] Encoding::EUC_KR, http://www.microsoft.com/globaldev/reference/dbcs/949.mspx, http://en.wikipedia.org/wiki/EUC-KR#EUC-KR,

CP950 -> Encoding

CP950 エンコーディングです。

Windows で使われる Big5 の亜種です。

[SEE_ALSO] http://msdn.microsoft.com/en-us/goglobal/cc305155.aspx

CP951 -> Encoding

CP951 エンコーディングです。

Windows で使われる Big5-HKSCS の亜種です。

[SEE_ALSO] http://www.microsoft.com/hk/hkscs/default.aspx, http://www.microsoft.com/downloads/en/details.aspx?FamilyID=0e6f5ac8-7baa-4571-b8e8-78b3b776afd7&DisplayLang=en, http://blogs.msdn.com/b/shawnste/archive/2007/03/12/cp-951-hkscs.aspx

EMACS_MULE -> Encoding
Emacs_Mule -> Encoding

Emacs-Mule エンコーディングです。

Emacsの多言語化(Mule)で使われているステートレスのエンコーディングです。

[SEE_ALSO] http://www.m17n.org/mule/pricai96/mule.en.html

EUC_CN -> Encoding
EUCCN -> Encoding
EucCN -> Encoding

ENC-CN エンコーディングです。

中国で用いられる簡体字中国語 EUCのエンコーディングです。 GB2312 と呼ばれることも多いです。

EUC_JP -> Encoding
EucJP -> Encoding
EUCJP -> Encoding

IANA Character Sets にある EUC-JP のことです。

日本語 EUC 亜種で、G0 が US-ASCII、G1 が JIS X 0201 片仮名図形文字集合、G2 が JIS X 0208、G3 が JIS X 0212 となっています。 EUC-JP を指定する場合は、それが実際には CP51932 のことである可能性を考えなければなりません。

EUCJP_MS -> Encoding
EucJP_ms -> Encoding
EUC_JP_MS -> Encoding

eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。

EUC-JPに加え、Windowsの機種依存文字とユーザ定義文字を扱うことができます。

[SEE_ALSO] http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/eucJP-ms.html, http://legacy-encoding.sourceforge.jp/wiki/index.php?eucJP-ms, http://blog.livedoor.jp/numa2666/archives/50980727.html

EUC_KR -> Encoding
EUCKR -> Encoding
EucKR -> Encoding

EUC-KR エンコーディングです。

韓国語 EUC のエンコーディングです。

EUC_TW -> Encoding
EUCTW -> Encoding
EucTW -> Encoding

EUC-TW エンコーディングです。

台湾で用いられる繁体字中国語 EUCのエンコーディングです。

GB12345 -> Encoding

GB 12345 エンコーディング。

GB 2312 から派生したもので、繁体字中国語を取り扱うエンコーディングです。

GB18030 -> Encoding

GBK エンコーディング

中国で用いられる中国語のエンコーディングです。

[SEE_ALSO] http://www.iana.org/assignments/charset-reg/GB18030

GB1988 -> Encoding

CB1988 エンコーディング。

ISO/IEC 646 の中国版です。

ISO_2022_JP -> Encoding
ISO2022_JP -> Encoding

ISO 2022-JP エンコーディングです。

[SEE_ALSO] http://tools.ietf.org/html/rfc1468

ISO_2022_JP_2 -> Encoding
ISO2022_JP2 -> Encoding

ISO-2022-JP-2 エンコーディングです。

ISO-2022-JP の拡張版です。

[SEE_ALSO] Encoding::ISO_2022_JP

ISO_8859_1 -> Encoding
ISO8859_1 -> Encoding

ISO-8859-1 エンコーディングです。

多くの西欧言語を含むさまざまなラテン文字言語を表現するための 8bitエンコーディングです。

Latin-1 とも呼ばれます。

ISO_8859_10 -> Encoding
ISO8859_10 -> Encoding

ISO 8859-10 エンコーディング。

北欧の言語を扱う 8bit single-byte エンコーディングです。

ISO_8859_11 -> Encoding
ISO8859_11 -> Encoding

ISO8859-11 エンコーディング。

タイ語を扱う 8bit single-byte エンコーディングです。

[SEE_ALSO] Encoding::TIS_620

ISO_8859_13 -> Encoding
ISO8859_13 -> Encoding

ISO8859-13 エンコーディング。

バルト語派の言語を扱う8bit single-byteエンコーディングです。

[SEE_ALSO] Encoding::Windows_1257

ISO_8859_14 -> Encoding
ISO8859_14 -> Encoding

ISO8859-14 エンコーディング。

ケルト語派の言語を扱う8bit single-byteエンコーディングです。

[SEE_ALSO] Encoding::Windows_1257

ISO_8859_15 -> Encoding
ISO8859_15 -> Encoding

ISO 8859-15 エンコーディング。

ISO 8859-1 の改訂版です。

ISO_8859_16 -> Encoding
ISO8859_16 -> Encoding

ISO 8859-16 エンコーディング。

東欧を中心とした地域の諸語を扱う 8bit single-byte エンコーディングです。

ISO_8859_2 -> Encoding
ISO8859_2 -> Encoding

ISO8859-2 エンコーディング。

中東欧の言語を扱う 8bit single-byte エンコーディングです。

ISO_8859_3 -> Encoding
ISO8859_3 -> Encoding

ISO8859-3 エンコーディング。

トルコ語、マルタ語、エスペラントを扱う 8bit single-byte エンコーディングです。

ISO_8859_4 -> Encoding
ISO8859_4 -> Encoding

ISO 8859-4 エンコーディング。

北欧の言語を扱う 8bit single-byte エンコーディングです。

ISO_8859_5 -> Encoding
ISO8859_5 -> Encoding

ISO 8859-5 エンコーディング。

キリル文字を用いる言語を扱う 8bit single-byte エンコーディングです。

ISO_8859_6 -> Encoding
ISO8859_6 -> Encoding

ISO8859-6 エンコーディング。

アラビア文字を扱う 8bit single-byte エンコーディングです。

[SEE_ALSO] Encoding::Windows_1256

ISO_8859_7 -> Encoding
ISO8859_7 -> Encoding

ISO8859-7 エンコーディング。

ギリシャ語を扱う 8bit single-byte エンコーディングです。

[SEE_ALSO] Encoding::Windows_1253

ISO_8859_8 -> Encoding
ISO8859_8 -> Encoding

ISO8859-8 エンコーディング。

ヘブライ語を扱う 8bit single-byte エンコーディングです。

[SEE_ALSO] Encoding::Windows_1255

ISO_8859_9 -> Encoding
ISO8859_9 -> Encoding

ISO8859-9 エンコーディング。

ISO8859-1 に近い、 トルコ語を扱うことができる8bit single-byteエンコーディングです。

[SEE_ALSO] Encoding::Windows_1254

ISO_2022_JP_KDDI -> Encoding

ISO-2022-JP-KDDI エンコーディングです。

ISO-2022-JP の亜種です。 KDDI の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf

KOI8_U -> Encoding

KOI8-U エンコーディング。

ウクライナ語のキリル文字で使われる8bit single-byteエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/KOI8-U

MacCentEuro -> Encoding
MACCENTEURO -> Encoding

MacCentEuro エンコーディング。

Mac OSで使われる 8bit single-byteエンコーディングで、 中欧および南東欧の言語を取り扱うものです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Macintosh_Central_European_encoding

MacCroatian -> Encoding
MACCROATIAN -> Encoding

MacCroatian エンコーディング。

Mac OS で使われる 8bit single-byteエンコーディングで、 クロアチア語、スベロニア語を取り扱うものです。

[SEE_ALSO] http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/CROATIAN.TXT

MacCyrillic -> Encoding
MACCYRILLIC -> Encoding

MacCyrillic エンコーディング。

Mac OS で使われる 8bit single-byte エンコーディングで、 キリル文字を取り扱うものです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Macintosh_Cyrillic_encoding

MacGreek -> Encoding
MACGREEK -> Encoding

MacGreek エンコーディング。

Mac OSで使われる 8bit single-byte エンコーディングで、 ギリシャ語のために使われます。

[SEE_ALSO] http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/GREEK.TXT

MacIceland -> Encoding
MACICELAND -> Encoding

MacIceland エンコーディング。

Mac OSで使われる 8bit single-byte エンコーディングで、 アイスランド語のために使われます

[SEE_ALSO] http://en.wikipedia.org/wiki/Mac_Icelandic_encoding

MacJapanese -> Encoding
MACJAPAN -> Encoding
MACJAPANESE -> Encoding
MacJapan -> Encoding

MacJapanese エンコーディング。

Mac OS の 9.x までで用いられていた Shift_JIS 亜種です。

[SEE_ALSO] http://unicode.org/Public/MAPPINGS/VENDORS/APPLE/JAPANESE.TXT, http://ja.wikipedia.org/wiki/MacJapanese

MacRoman -> Encoding
MACROMAN -> Encoding

MacRoman エンコーディング。

Mac OSで使われる 8bit single-byte エンコーディングで、 西欧を中心としたラテン文字を用いる諸語を取り扱うためのものです。

IANA character-sets で "macintosh" で表現されるものです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Mac_OS_Roman

MacRomania -> Encoding
MACROMANIA -> Encoding

MacRoman エンコーディング。

Mac OSで使われる 8bit single-byte エンコーディングで、 ルーマニア語のために使われます。

[SEE_ALSO] http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/ROMANIAN.TXT

MacThai -> Encoding
MACTHAI -> Encoding

MacThai エンコーディング。

タイ語を扱うエンコーディングで、ISO8859-11の亜種です。

[SEE_ALSO] Encoding::TIS_620, Encoding::ISO_8859_11

MacTurkish -> Encoding
MACTURKISH -> Encoding

MacTurkish エンコーディング。

Mac OSで使われる 8bit single-byte エンコーディングで、 トルコ語のために使われます。

[SEE_ALSO] http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/TURKISH.TXT

MacUkraine -> Encoding
MACUKRAINE -> Encoding

MacUkraine エンコーディング。

Mac OS で使われる、ウクライナ語キリル文字を取り扱うエンコーディング。 MacCyrillic の亜種です。

[SEE_ALSO] http://en.wikipedia.org/wiki/Macintosh_Ukrainian_encoding

Shift_JIS -> Encoding
SHIFT_JIS -> Encoding
SJIS -> Encoding

IANA Character Sets にある Shift_JIS のことです。

基本的にはJIS X 0208:1997の付属書1にある「シフト符号化表現」のことですが、 Ruby M17N では 7bit 部分が US-ASCII になっています。

SJIS_DOCOMO -> Encoding
SJIS_DoCoMo -> Encoding

SJIS-DoCoMo エンコーディングです。

Shift_JIS, CP932 の亜種です。 DoCoMo の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] http://www.nttdocomo.co.jp/english/service/imode/make/content/pictograph/basic/index.html, http://www.nttdocomo.co.jp/english/service/imode/make/content/pictograph/extention/index.html,

SJIS_KDDI -> Encoding

SJIS-KDDI エンコーディングです。

Shift_JIS, CP932 の亜種です。 KDDI の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf

SJIS_SOFTBANK -> Encoding
SJIS_SoftBank -> Encoding

SJIS-SoftBank エンコーディングです。

Shift_JIS, CP932 の亜種です。 SoftBank の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] http://creation.mb.softbank.jp/web/web_pic_about.html, http://www2.developers.softbankmobile.co.jp/dp/tool_dl/download.php?docid=120&companyid=

STATELESS_ISO_2022_JP -> Encoding
Stateless_ISO_2022_JP -> Encoding

stateless-ISO-2022-JP エンコーディングです。

ISO-2022-JPをステートレスに扱うための方式です。 Emacs-Mule エンコーディングを元にしています。

STATELESS_ISO_2022_JP_KDDI -> Encoding
Stateless_ISO_2022_JP_KDDI -> Encoding

stateless-ISO-2022-JP-KDDI エンコーディングです。

stateless-ISO-2022-JP の亜種です。 KDDI の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf

TIS_620 -> Encoding

TIS-620 エンコーディング。

タイ語を扱うためのエンコーディングで、 ISO8859-11 とほぼ 同一のエンコーディングです。

[SEE_ALSO] http://en.wikipedia.org/wiki/Thai_Industrial_Standard_620-2533

UTF_16BE -> Encoding
UCS_2BE -> Encoding

UTF-16BE (ビッグエンディアン) です。

BOM を含みません。

UTF_32BE -> Encoding
UCS_4BE -> Encoding

UTF-32BE (ビッグエンディアン) です。

BOM を含みません。

UTF_32LE -> Encoding
UCS_4LE -> Encoding

UTF-32LE (リトルエンディアン) です。

BOM を含みません。

UTF8_DOCOMO -> Encoding
UTF8_DoCoMo -> Encoding

UTF8-DoCoMo エンコーディングです。

UTF-8 の亜種です。 DoCoMo の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] http://www.nttdocomo.co.jp/english/service/imode/make/content/pictograph/basic/index.html, http://www.nttdocomo.co.jp/english/service/imode/make/content/pictograph/extention/index.html,

UTF8_KDDI -> Encoding

UTF8-KDDI エンコーディングです。

UTF8 の亜種です。 KDDI の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] http://www.au.kddi.com/ezfactory/tec/spec/img/typeD.pdf

UTF8_MAC -> Encoding
UTF_8_MAC -> Encoding
UTF_8_HFS -> Encoding

UTF8-MAC、アップルによって修正された Normalization Form D(分解済み)という形式のUTF-8です。

[SEE_ALSO] http://developer.apple.com/jp/technotes/tn1150.html, http://developer.apple.com/jp/technotes/tn2078.html

UTF8_SOFTBANK -> Encoding
UTF8_SoftBank -> Encoding

UTF8-SoftBank エンコーディングです。

UTF-8 の亜種です。 SoftBank の携帯電話で使われる絵文字が含まれています。

[SEE_ALSO] http://creation.mb.softbank.jp/web/web_pic_about.html, http://www2.developers.softbankmobile.co.jp/dp/tool_dl/download.php?docid=120&companyid=

UTF_16 -> Encoding

UTF-16 (BOMを含む) です。

ダミーエンコーディングです。

UTF_16LE -> Encoding

UTF-16LE (リトルエンディアン) です。

BOM を含みません。

UTF_32 -> Encoding

UTF-32 (BOMを含む) です。

ダミーエンコーディングです。

class Encoding