[<a href="./?q=buzei">buzei</a>]の検索結果


任意のキーワードリストに含まれるテキスト中のキーワードに、特定のページ(URL)にリンクするPerlのサンプルスクリプトを作ってみました。ブログソフトとか掲示板ソフトを開発する際に役に立つと思います。文字エンコードがUTF-8、EUCではOKでしたが、SJISではうまく動きませんでした。

以下、サンプルスクリプトの一部です。
my @wordlist = ('はてな', 'ブログ', 'アルファブロガー');
foreach my $word (@wordlist) {
my $encword = $word;
$encword =~ s/(\W)/'%'.unpack('H2', $1)/eg; # uri encode
my $link = "<a href=\"serach.cgi?querystr=$encword\">$word</a>";
$text =~ s/$word/$link/g;
# アンカーテキストのキーワードは元に戻す
my $pattern = "(<a href.+)<a href.+$word</a>(.+/a>)";
$text =~ s/$pattern/$1$word$2/g;
}
print $text;

リンクの処理のところが微妙ですが、適当に修正して使っていただければ幸いです。

はてなダイアリーのキーワードにリンクするためのサンプルもあるようです。動かしてみたわけでないのでハッキリとはいえませんが、ソースを見る限りテキスト内でアンカータグでリンクを行っている場合は、まずいような気もします。

はてなダイアリーキーワード自動リンクAPI - はてなダイアリー日記
なお、上記ファイルは現状で300KBほどありますので、アプリケーション側で一定時間キャッシュして頂くなどの措置をお願いできればと思います。
テキスト一つ処理するだけで300KBですか、はてな側も大変かも知れませんが呼び出す方も大変ですね。
[225] Posted by buzei at 2008/02/24 23:46:55
0 point | Link (1) | Trackback (0) | Comment (0)

  1  


アクセスランキング

今日のアクセスランキング(上位10件)

  1. SQLプログラミング質問スレ (4 PV)
  2. [掲示板]59bbs のダウンロード(Perl/CGI)[フリーソフト] (2 PV)
  3. 岡沢高宏の相棒でヤクザの金村剛弘(金剛弘)が西新宿の路上で襲撃され死亡 (2 PV)
  4. 大和 RMT 業界最安値 (1 PV)
  5. 豪ケビン・ラッド首相は泥棒の血統を持つ「生粋のオーストラリア人」 (1 PV)
  6. オープン2ちゃんねる (1 PV)
  7. 5ちゃんねる(5ch.net、旧2ちゃんねる)掲示板 (1 PV)

今月のアクセスランキング(上位10件)

  1. 5ちゃんねる(5ch.net、旧2ちゃんねる)掲示板 (26 PV)
  2. プリンセスガーデンホテル女性社長の「片岡都美」氏はフジモリ元大統領夫人 (25 PV)
  3. 掲示板やチャットなどのフリーPHPスクリプトの配布サイト (16 PV)
  4. 「真実を探すブログ」と「カレイドスコープ」が互いに誹謗・中傷と非難の応酬 (15 PV)
  5. SQLプログラミング質問スレ (14 PV)
  6. 伝説の男、瓜田純士さんが新宿駅構内で2週間前に割腹自殺を図る (11 PV)
  7. オープン2ちゃんねる (10 PV)
  8. [掲示板]59bbs のダウンロード(Perl/CGI)[フリーソフト] (9 PV)
  9. 2chみたいな掲示板「PHP 2chBBS」 (9 PV)
  10. 2ちゃんねる(2ch)検索 掲示板 - スレタイ、過去ログ、全文検索 (8 PV)

アクセス統計

ディレクトリ

関連サイト