2008-02-06から1日間の記事一覧

1.10 Unicode文字列をオクテット単位で扱う

Unicode文字列をオクテット単位で扱いたい(例えば、その文字列の長さを計算するため、あるいは入出力を行うため)。 # use bytesプラグマを使う方法 $ff = "\x{FB00}"; # ffリガチャ(合字) $chars = length($ff); # 長さは1文字 { use bytes; # バイトセマン…

1.9 Unicode合成文字が含まれている文字列を正規化する

出力すると全く同じに見える文字列でも、eqで等しいかどうかを検証すると等しくなかったり、場合によってはそれぞれの長さが異なっていたりする。このような文字列をPerlに同じだと認識させたい。 # 等しくない文字列の一方または両方にUnicodeの基底文字と…

1.8 Unicode合成文字を1つの文字として扱う

合成文字を含むUnicode文字列がある。これらの文字シーケンスのそれぞれを1つの論理文字として扱いたい(通常の文字はそのままで、基底文字と結合文字のペアは1つの文字として扱いたい)。 # 正規表現の\Xを利用すれば、基底文字と結合文字のペアを1つの文字と…

1.7 文字列を単語または文字単位で逆順にする

文字列内の単語、または文字を逆順にしたい $revchars = revserse($string); $revwords = join(" ", reverse split(" ", $string));

週刊ダイアモンド

巷で評判の勝間さんの本を買おうかどうか迷っていたので、手頃なところで雑誌から入りました。週刊 ダイヤモンド 2008年 2/9号 [雑誌]出版社/メーカー: ダイヤモンド社発売日: 2008/02/04メディア: 雑誌購入: 1人 クリック: 79回この商品を含むブログ (66件)…

1.6 文字列を1文字ずつ処理する

文字列内の各文字を1文字ずつ処理したい。 @array = split(//, $string); # 個々の文字に分解 @array = unpack("U*", $string); # コードポイント(数値コード)に分解 # ループを使用して、各文字を順番に抽出 while(/(.)/g) { }

1.5 Unicodeの名前付き文字を使用する

Unicodeで利用できる特殊な文字を、コードポイント以外の方法で指定したい。 ファイルの先頭行にuse charnamesプラグマを書き、文字列リテラル内に"\N{CHARSPEC}"エスケープを挿入する。

子供から学ぶこと

う〜ん、なんだろ。産まれてから、早2.5ヶ月が経つ。この間にいろいろあって、子供も少しずつ大きくなって、いまや、わけわからない言葉をしゃべるようになった。産まれた直後は、すご〜くか弱い子だったけど、わずか70日あまりで、もうしっかりした個体にな…