Ruby 1.9.3 リファレンスマニュアル > ライブラリ一覧 > uriライブラリ > URIモジュール

module URI

クラスの継承リスト: URI

要約

URI を扱うためのモジュールです。

特異メソッド

unescape(str) -> String
decode(str) -> String

URI 文字列をデコードした文字列を返します。

このメソッドは obsolete です。

例:

require 'uri'
puts URI.unescape('http://images.google.co.jp/images?q=%A5%E2%A5%CA%A5%EA%A5%B6&ie=EUC-JP')

#=> "http://images.google.co.jp/images?q=モナリザ&ie=EUC-JP"
[PARAM] str:
URI を文字列として与えます。
decode_www_form(str, enc=Encoding::UTF_8) -> [[String, String]]

文字列から URL-encoded form data をデコードします。

application/x-www-form-urlencoded 形式のデータをデコードし、 [key, value] という形の配列の配列を返します。

enc で指定したエンコーディングの文字列が URL エンコードされたものと みなし、エンコーディングを付加します。

「_charset_ hack」はサポートされていません。 これで指定されたエンコーディングと Ruby のエンコーディングとの 対応がはっきりしないからです。これに関しては http://www.w3.org/TR/html5/parsing.html#character-encodings-0 も見てください。

このメソッドは http://www.w3.org/TR/html5/association-of-controls-and-forms.html#url-encoded-form-data にもとづいて実装されています。

ary = URI.decode_www_form("a=1&a=2&b=3")
p ary                  #=> [['a', '1'], ['a', '2'], ['b', '3']]
p ary.assoc('a').last  #=> '1'
p ary.assoc('b').last  #=> '3'
p ary.rassoc('a').last #=> '2'
p Hash[ary]            # => {"a"=>"2", "b"=>"3"}
[PARAM] str:
デコード対象の文字列
[PARAM] enc:
エンコーディング
[EXCEPTION] ArgumentError:
str のフォーマットが不正である場合に発生します

[SEE_ALSO] URI.decode_www_form_component, URI.encode_www_form

decode_www_form_component(str, enc=Encoding::UTF_8) -> String

URL-encoded form data の文字列の各コンポーネント をデコードした文字列を返します。

通常は URI.decode_www_form を使うほうがよいでしょう。

"+" という文字は空白文字にデコードします。

enc で指定したエンコーディングの文字列が URL エンコードされたものと みなし、エンコーディングを付加します。

このメソッドは http://www.w3.org/TR/html5/association-of-controls-and-forms.html#url-encoded-form-data にもとづいて実装されています。

[PARAM] str:
デコード対象の文字列
[PARAM] enc:
エンコーディング
[EXCEPTION] ArgumentError:
str のフォーマットが不正である場合に発生します

[SEE_ALSO] URI.encode_www_form_component, URI.decode_www_form

escape(str, unsafe = URI::UNSAFE) -> String
encode(str, unsafe = URI::UNSAFE) -> String

URI 文字列をエンコードした文字列を返します。

このメソッドは obsolete です。

代わりに ERB::Util.url_encode, CGI.escape, URI.encode_www_form_component, WEBrick::HTTPUtils.escape_form, WEBrick::HTTPUtils.escape などの使用を検討してください。 詳細は [ruby-core:29293] からのスレッドを参照してください。

例:

require 'uri'
p URI.escape('http://images.google.co.jp/images?q=モナリザ&ie=EUC-JP')

#=> "http://images.google.co.jp/images?q=%A5%E2%A5%CA%A5%EA%A5%B6&ie=EUC-JP"
[PARAM] str:
URI を文字列として与えます。
[PARAM] unsafe:
URI として指定できない文字を正規表現か文字列で指定します。
encode_www_form(enum) -> String

enum から URL-encoded form data を生成します。

HTML5 で定義されている application/x-www-form-urlencoded 形式の 文字列を生成します。

enum には通常 [key, value] という形の配列の配列を渡します。 以下の例を見てください。

URI.encode_www_form([["a", "1"], ["b", "2"], ["c", "x yz"]])
# => "a=1&b=2&c=x+yz"

実際には、each のブロック呼び出しで [key, value] の形のデータを渡すものであれば 何でも渡すことができます(例えば Hash など)。

URI.encode_www_form({"a"=>"1", "b"=>"2", "c"=>"x yz"})
# => "a=1&b=2&c=x+yz"

このメソッドは引数のエンコーディングを変換しません。そのため 送るデータのエンコーディングを変換したい場合はあらかじめ 変換しておいてください(例えば ASCII incompatible なものを UTF-8 に変換する場合など)。 各要素のエンコーデイングがばらばらの場合もあらかじめエンコーディングを 揃えてからこのメソッドを使うべきです。

このメソッドはファイルを入力にすることはできません。 ファイルを送りたい場合は multipart/form-data をつかうべきで このメソッドを使うべきではありません。

このメソッドは内部的に URI.encode_www_form_component を使っています。

このメソッドは http://www.w3.org/TR/html5/association-of-controls-and-forms.html#url-encoded-form-data にもとづいて実装されています。

[PARAM] enum:
エンコードするデータ列([key, value] という形のデータの列)

[SEE_ALSO] URI.encode_www_form_component, URI.decode_www_form

encode_www_form_component(str) -> String

文字列を URL-encoded form data の1コンポーネント としてエンコードした文字列を返します。

通常は URI.encode_www_form を使うほうがよいでしょう。

このメソッドでは *, -, ., 0-9, A-Z, _, a-z, は変換せず、 空白は + に変換し、その他は %XX に、変換します。

このメソッドは http://www.w3.org/TR/html5/association-of-controls-and-forms.html#url-encoded-form-data にもとづいて実装されています。

[PARAM] str:
エンコードする文字列

[SEE_ALSO] URI.decode_www_form_component, URI.encode_www_form

extract(str) -> [String]
extract(str, schemes) -> [String]
extract(str) {|uri_str| ... } -> nil
extract(str, schemes) {|uri_str| ... } -> nil

文字列 str に対してパターンマッチングを試み、 絶対URIにマッチした部分文字列からなる配列として返します。 抽出する URI がなければ空の配列を返します。

第2引数に文字列の配列 schemes が与えられた場合は そのスキームだけを検索します。

ブロックが与えられた場合は String#scan と同様で、 マッチした部分がみつかるたびに uri_str に その部分を代入してブロックを評価します。 このときは nil を返します。

[PARAM] str:
文字列を与えます。
[PARAM] schemes:
検索の対象としたいスキームを、文字列の配列として与えます。

例:

require 'uri'
str = "
        http://www.ruby-lang.org/
        http://www.ruby-lang.org/man-1.6/
"
p URI.extract(str, ["http"])
=> ["http://www.ruby-lang.org/", "http://www.ruby-lang.org/man-1.6/"]
join(uri_str, *path) -> object

文字列 uri_str と path ... を URI として連結して得られる URI オブジェクトを返します。

[RFC2396] の Section 5.2 の 仕様に従って連結します。 以下と等価です

URI.parse(uri_str) + path + ...
[PARAM] uri_str:
URI 文字列
[PARAM] path:
後ろに連結する文字列
[EXCEPTION] URI::InvalidURIError:
パースに失敗した場合に発生します。

例:

require 'uri'
p URI.join('http://www.ruby-lang.org/', '/ja/man-1.6/')
=> #<URI::HTTP:0x2010017a URL:http://www.ruby-lang.org/ja/man-1.6/>
parse(uri_str) -> object

与えられた URI から該当する URI::Generic のサブクラスのインスタンスを生成して 返します。scheme が指定されていない場合は、URI::Generic オブジェクトを返します。

[PARAM] uri_str:
パースしたい URI を文字列として与えます。
[EXCEPTION] URI::InvalidURIError:
パースに失敗した場合に発生します。

例:

require 'uri'
p uri = URI.parse("http://www.ruby-lang.org/")

# => #<URI::HTTP:0x201002a6 URL:http://www.ruby-lang.org/>
p uri.scheme    # => "http"
p uri.host      # => "www.ruby-lang.org"
p uri.port      # => 80
p uri.path      # => "/"
regexp -> Regexp
regexp(schemes) -> Regexp

URIにマッチする正規表現を返します。

schemes を与えた場合は、そのスキームの URI にのみマッチする 正規表現を返します。

いずれの場合も返り値の正規表現は不定数の正規表現グループ (括弧) を含みます。この括弧の数はバージョンによって変動 する可能性があるので、それに依存したコードを書くべきでは ありません。

また、有効なURIではない文字列(たとえば"http://") にも マッチするため、有効なURIかどうかは必要に応じて別途 検査してください。

[PARAM] schemes:
マッチさせたいスキームを、文字列の配列として与えます。

例:

require 'uri'
p URI.regexp =~ "http://www.ruby-lang.org/"  #=> 0
split(url) -> [String | nil]

URI を要素に分割した文字列の配列を返します。

各要素の種類と順番は以下のとおりです。

  • scheme
  • userinfo
  • host
  • port
  • registry
  • path
  • opaque
  • query
  • fragment
[PARAM] url:
パースしたい URI を文字列として与えます。
[EXCEPTION] URI::InvalidURIError:
パースに失敗した場合に発生します。

例:

require 'uri'
p URI.split("http://www.ruby-lang.org/")
#=> ["http", nil, "www.ruby-lang.org", nil, nil, "/", nil, nil, nil]

定数

UNSAFE -> Regexp

URIとして指定できない文字にマッチする正規表現

/[^-_.!~*'()a-zA-Z\d;\/?:@&=+$,\[\]]/n

です。

module URI