[プログラミング]の検索結果


URLから元ページのタイトルを取得するためのPerlのサンプルスクリプトです。
処理手順は以下の通りです。

1.ページURLを元にHTMLソースを取得する。
2.タイトルタグで囲まれている文字列を抜き出す。

対象のページがどんな文字エンコードで記述されているか不明なので、文字エンコードの変換処理も行っています。

use LWP::Simple;
use Jcode;

#my $pageurl = "http://www.01club.org/59log/";
my $pageurl = "http://59bbs.org/";
my $content = get($pageurl);
my $title = '';
my $pattern = "<title>(.+)</title>";
if($content =~ m/$pattern/i) {
$title = $1;
}

# 文字コードをSJISに変換
my ($code, $nmatch) = Jcode::getcode(\$title);
$title = Jcode->new($title, $code)->sjis;
print "$title\n";


サンプルコードではタイトルだけ取得してますが、正規表現のパターンを変更することで、本文も取得なども行えるはずです。
[231] Posted by buzei at 2008/03/02 22:35:06
0 point | Link (1) | Trackback (0) | Comment (0)

任意のキーワードリストに含まれるテキスト中のキーワードに、特定のページ(URL)にリンクするPerlのサンプルスクリプトを作ってみました。ブログソフトとか掲示板ソフトを開発する際に役に立つと思います。文字エンコードがUTF-8、EUCではOKでしたが、SJISではうまく動きませんでした。

以下、サンプルスクリプトの一部です。
my @wordlist = ('はてな', 'ブログ', 'アルファブロガー');
foreach my $word (@wordlist) {
my $encword = $word;
$encword =~ s/(\W)/'%'.unpack('H2', $1)/eg; # uri encode
my $link = "<a href=\"serach.cgi?querystr=$encword\">$word</a>";
$text =~ s/$word/$link/g;
# アンカーテキストのキーワードは元に戻す
my $pattern = "(<a href.+)<a href.+$word</a>(.+/a>)";
$text =~ s/$pattern/$1$word$2/g;
}
print $text;

リンクの処理のところが微妙ですが、適当に修正して使っていただければ幸いです。

はてなダイアリーのキーワードにリンクするためのサンプルもあるようです。動かしてみたわけでないのでハッキリとはいえませんが、ソースを見る限りテキスト内でアンカータグでリンクを行っている場合は、まずいような気もします。

はてなダイアリーキーワード自動リンクAPI - はてなダイアリー日記
なお、上記ファイルは現状で300KBほどありますので、アプリケーション側で一定時間キャッシュして頂くなどの措置をお願いできればと思います。
テキスト一つ処理するだけで300KBですか、はてな側も大変かも知れませんが呼び出す方も大変ですね。
[225] Posted by buzei at 2008/02/24 23:46:55
0 point | Link (1) | Trackback (0) | Comment (0)

ソフトウェア開発に関する多くの名著を持つジェラルド・M・ワインバーグ氏がコンサルタントとして生きていくため必要な16の道具を紹介している。「コンサルタントの秘密」の続編。

コンサルタントの道具箱
著者:ジェラルド・M・ワインバーグ,伊豆原 弓
日経BP社

by Amalink

「コンサルタントの道具箱」という題名ですが、プログラマはもちろんですが、ソフトウェア開発に携わっている人すべてにとって役立つ本だと思います。特に以下の質問は今の私にとってとてもタイムリーな質問でした。
サティアの三つの普遍的な質問
  • 私はどうしてここにいるのだろう?(過去)
  • 私はここにいることをどう思っているのだろう?(現在)
  • 私は何を実現したいのだろう?(未来)

まあ、答えはすでに出していたのですが、正しい結論だったと確信できました。
[207] Posted by buzei at 2008/02/04 23:06:25
1 point | Link (2) | Trackback (0) | Comment (1)

日本では2008年2月13日からIEの7自動更新が開始されることが、マイクロソフト日本法人から正式に発表されました。2008年2月13日より自動更新機能による Windows Internet Explorer 7 の配布開始Windows Internet Exp...
[206] Posted by buzei at 2008/02/04 21:04:53
0 point | Link (1) | Trackback (0) | Comment (0)

出来上がったプログラムがちゃんと動くと嬉しいものですが、ソフトウェア開発の作業自体はとても地味なものです。残念ながらソフトウェアが魔法のように出来上がるなんてことはありません。プログラミングは一つ一つ...
[148] Posted by buzei at 2007/12/11 04:22:48
0 point | Link (2) | Trackback (0) | Comment (0)

当サイト(掲示板 59bbs.org)で開発・配布している「59bbs」は、Perl/CGI環境で動作するオープンソースの掲示板ソフトですが、競合調査のためPHP、MySQLで動く他のオープンソース掲示板ソフトにどんなものがあるのか...
[137] Posted by buzei at 2007/12/02 17:28:14
4 point | Link (17) | Trackback (0) | Comment (4)

ブラック会社に勤めてるんだが、もう俺は限界かもしれない職業はプログラマ。この職業、マジでやばすぎる。入社日での出来事。パソコンを渡される→指示された通り、色々なものをインストール→設計書を渡される。「...
[136] Posted by buzei at 2007/12/02 17:03:05
3 point | Link (5) | Trackback (0) | Comment (3)

Perlで日本語を扱うWebアプリを開発する際に必要になるのが、文字コード(エンコード)を変換するためのモジュールです。Webアプリのターゲットとなる運用環境でPerl 5.8が使えるのであればEncodeモジュールを利用す...
[133] Posted by buzei at 2007/11/29 06:35:13
0 point | Link (2) | Trackback (0) | Comment (0)

Perl(パール)とは、Larry Wall氏によって開発された、テキストの検索や抽出やレポート作成に適した、C言語に似た表記法のスクリプトプログラミング言語で、テキスト処理に優れていることから、CGIとしてWebアプリケ...
[132] Posted by buzei at 2007/11/29 06:12:03
0 point | Link (7) | Trackback (0) | Comment (0)

アマゾン(Amazon)商品リンク作成ツール「Amalink」を、キーワードでリンクを作成したい商品の検索ができるように機能アップしました。アマゾン(Amazon)商品リンク作成ツール - Amalinkソースファイルのダウンロード再...
[128] Posted by buzei at 2007/11/18 16:17:08
1 point | Link (3) | Trackback (0) | Comment (1)

|< 先頭へ  < 前へ  2 3 4 5 6  次へ >


アクセスランキング

今日のアクセスランキング(上位10件)

  1. [大阪維新の会]大阪市交通局の市長選支援職員リスト捏造事件 (13 PV)
  2. スクエニ和田洋一社長、FF14の不評を認める (12 PV)
  3. 日本IT漫画新聞 (12 PV)
  4. ヨルダン政府、ヨルダン人パイロット殺害の報復としてリシャウィ死刑囚の死刑を執行 (10 PV)
  5. NBA ジャージ (10 PV)
  6. アナログマとは (9 PV)
  7. ブレイドクロニクル RMT (9 PV)
  8. 鳩山辞任で民主党支持率急回復、ネトウヨ狼狽 (9 PV)
  9. 藤原紀香、陣内智則夫妻が離婚 (8 PV)
  10. 財政の崖(フィスカル・クリフ) (8 PV)

今月のアクセスランキング(上位10件)

  1. 掲示板フリーソフト - 無料で利用できる掲示板CGI (27 PV)
  2. 掲示板やチャットなどのフリーPHPスクリプトの配布サイト (21 PV)
  3. スクエニ和田洋一社長、FF14の不評を認める (15 PV)
  4. 【速報】パナマ文書に記載されている日本企業、日本人の一覧リスト (15 PV)
  5. WebRMT【ウェブRMT】-ラペルズ-RAPPELZ-RMT (14 PV)
  6. k本的に無料ソフト・フリーソフト (14 PV)
  7. [大阪維新の会]大阪市交通局の市長選支援職員リスト捏造事件 (14 PV)
  8. 日本IT漫画新聞 (14 PV)
  9. NBA ジャージ (13 PV)
  10. 紅茶に含まれる成分が骨粗しょう症に効果 体重60キロなら3日に一度60杯の紅茶を飲めば効果:お料理速報 (13 PV)

アクセス統計

ディレクトリ

関連サイト