Wikipedia

データベースがダウンロードできることに気付いたのでダウンロード。たくさんのファイルがあって、どれをダウンロードすればいいのか迷った。(ja.なんとかを選ぶ)
日本語版は充実してるみたいで、かなり大きめ。展開すると408MBのSQLファイルが出てきた。
Let's note R1にMySQL 4.1を入れて、データベースを取り込む。まさか45分もかかるとは。
この前やったばかりのミスを再現してしまった。UTF-8なのにLatin1で…。やり直すのは面倒なので、とりあえずLatin1に統一して変換が入らないように。(要するになにもしなかった)
出力は読めないのでリダイレクトしてファイルに入れてエディタで読む。

C:\>mysqladmin -u root -p create wikipedia
C:\>mysql -u root -p wikipedia < 20050406_cur_table.sql
C:\>mysql -u root -p wikipedia > tmp.txt
select cur_title from cur;
exit;

できあがった tmp.txt は4MBで 214,165 行あった。