日本語テキストから韻のふめる言葉を抜き出す

# Usage: ruby extract_rhyme.rb [-m (vowel|vowel_with_help|surface)] -n N /path/to/file.txt

カタカナまんま (デフォルト、-m surface)

$ ruby extract_rhyme.rb -n 3  夏目漱石_坊ちゃん.txt | head
アカリ: 月あかり | 灯 | 星明り
アガル: 上がる | 起き上がる | 飛び上がる | 揚がる
アゲル: 上げる | あげる | 取り上げる | 揚げる
アタリ: 辺 | 見当り | 大当り | 心当り | 中り | 突き当り | 辺り
アタル: 思い当る | あたる | 中る
アルイ: 歩い | あるい | ねりあるい
アワセ: 袷 | 不仕合せ | 申し合せ | 打ち合せ | 合せ | 待ち合せ | 仕合せ | 見合せ
イガイ: 以外 | 大概 | 例外
イサイ: 制裁 | 体裁 | 委細
イサツ: 挨拶 | 推察 | 警察

母音 (-m vowel)

$ ruby extract_rhyme.rb -n 4 -m vowel 夏目漱石_坊ちゃん.txt | tail
オオイア: 床板 | 木の下 | ここいら
オオイイ: 恐ろしい | 騒々しい | 明後日 | よろしい | 乏しい | 思い切っ | 思いきっ
オオイウ: よろしく | 落っこちる | 頼もしく | 騒々しくっ
オオイオ: 思い込ん | 面白 | ごろりと | 躍り込ん
オオエウ: 泳げる | 恐る | 求める | 覚える | 見届ける
オオオア: ところが | 及ぼさ | 床の間 | どころか
オオオイ: 驚 | 驚い | 心持ち | 試み | もとより | 横取り | 一昨日
オオオウ: ことごとく | 喜ぶ | 及ぼす | 驚く
オオオエ: 心得 | 整え | 物覚え | 懐手
オオオオ: のそのそ | ごろごろ | ホホホホ | 色男 | そろそろ | きょろきょろ | ぞろぞろ | ちょろちょろ | そこそこ | よろよろ | もともと | 所々

母音 (-m vowel_with_help, ッーンを含む)

$ ruby extract_rhyme.rb -n 4 -m vowel_with_help 夏目漱石_坊ちゃん.txt | egrep "ッ|ー|ン"
ウアアアッ: 済まなかっ | ぶら下がっ | ぶらさがっ
オイアアッ: 飛びかかっ | 飛び上がっ | 持ち上がっ | 躍り上がっ | 起き上がっ | 取りかかっ
オーアアイ: 大当り | 大騒ぎ | 遠廻し