1.10 Unicode文字列をオクテット単位で扱う

Perl Cookbook

Unicode文字列をオクテット単位で扱いたい(例えば、その文字列の長さを計算するため、あるいは入出力を行うため)。 # use bytesプラグマを使う方法 $ff = "\x{FB00}"; # ffリガチャ(合字) $chars = length($ff); # 長さは1文字 { use bytes; # バイトセマン…

2008-02-06

1.9 Unicode合成文字が含まれている文字列を正規化する

Perl Cookbook

出力すると全く同じに見える文字列でも、eqで等しいかどうかを検証すると等しくなかったり、場合によってはそれぞれの長さが異なっていたりする。このような文字列をPerlに同じだと認識させたい。 # 等しくない文字列の一方または両方にUnicodeの基底文字と…

2008-02-06

1.8 Unicode合成文字を1つの文字として扱う

Perl Cookbook

合成文字を含むUnicode文字列がある。これらの文字シーケンスのそれぞれを1つの論理文字として扱いたい(通常の文字はそのままで、基底文字と結合文字のペアは1つの文字として扱いたい)。 # 正規表現の\Xを利用すれば、基底文字と結合文字のペアを1つの文字と…

2008-02-06

1.7 文字列を単語または文字単位で逆順にする

Perl Cookbook

文字列内の単語、または文字を逆順にしたい $revchars = revserse($string); $revwords = join(" ", reverse split(" ", $string));

2008-02-06

週刊ダイアモンド

本

巷で評判の勝間さんの本を買おうかどうか迷っていたので、手頃なところで雑誌から入りました。週刊ダイヤモンド 2008年 2/9号 [雑誌]出版社/メーカー: ダイヤモンド社発売日: 2008/02/04メディア: 雑誌購入: 1人クリック: 79回この商品を含むブログ (66件)…

2008-02-06

1.6 文字列を1文字ずつ処理する

Perl Cookbook

文字列内の各文字を1文字ずつ処理したい。 @array = split(//, $string); # 個々の文字に分解 @array = unpack("U*", $string); # コードポイント(数値コード)に分解 # ループを使用して、各文字を順番に抽出 while(/(.)/g) { }