CMS構築での記事の流し込みには自動インポートだけでなく、手入力での投稿も必ず行います。サーバーとの相性によるエラー、インストール失敗などによる不具合をチェックするためです。
先日公開したa-blog cmsテーマ「site2015mini」のテスト記事の文章は「吾輩は猫である」「セロ弾きのゴーシュ」「賢者の贈り物」の抜粋となっています。
ここ数年はこれらと、50音の羅列200文字分を使っています。今回はダミー素材に関する試行錯誤の話です。
ランダム文と不気味の谷
ひらがな、カタカナ、漢字、英数字、記号と、使用する文字が多彩な日本語には、英語の「Lorem ipsum」のような定型文がありません。
また、Lorem ipsumばかり書いていてもテストにはなりません。
フリーランスになって何年かは「すぐ使えるダミーテキスト」を利用させてもらっていました。
夏目漱石、宮沢賢治、Wikipediaのガイドラインの他に、自分で用意した好きな文章をランダムに組み合わせてくれるサービスです。利用したことがある人がほとんどだとおもいます。
このサービスで生成されるテキストはすばらしいのですが、これで投稿したエントリーを一覧表示すると、かなりの違和感を感じるようになりました。微妙に本物と異なるものに対して感じる恐怖感、いわゆる「不気味の谷」です。
当時はデザインも請け負っていたので、これを流し込んだ状態でのデザインチェックに落ち着かなさを感じるようになり、けっきょく、生きた文章を使うことにしました。
ニュースも試してみたが
私たちが見るいちばん身近な公式文書に、毎日のインターネットニュースがあります。
非公開のテストサーバーなら問題なかろう、ということで、Yahoo!ニュースからの記事・写真の抜粋を試したことがあります。
文章テストとしてはなかなか良かったのですが、これは長く続きませんでした。クライアントに不快感を与えない題材を選ぶのが、意外に面倒だったことが理由です。
事件・政治・芸能はアウトですから、スポーツニュースをコピペしていたのですが、あるとき、固めの案件のときに「競馬はNGでお願いします」と言われました。よく考えたら、お馬さんはギャンブルでした…
細かく考えていくと、スポーツでもクライアントのスポンサーチームなどがあったりします。そういうことを警戒しながらだと早くテストができません。そんなこんなで、ニュースもボツになりました。
近代文学を使う理由
その後は、「吾輩は猫である」をはじめとする、近代文学の抜粋に落ち着きました。
青空文庫からコピペして、適切な改行を入れたり「ゐる」などの古い表現を置換したものを15パターンほど、「Snippets」というアプリからショートコマンドで呼び出せる状態にして使っています。
Snippets — Code Snippets Management Tools for Mac & Windows
近代文学が良いと思っているのは、以下のような理由です。
- 著作権が消失しているのでテーマのサンプルデータとして配布できる
- 読点、句読点のバランスが良い
- 書き出しや固有名詞で、明らかにダミー文とわかる
- 作品別・作者別でカテゴリー分類のテストもできる
特に「吾輩は猫である」は良いです。猫が嫌いな人はほとんどいないですから。
特殊なフォーマットの記事が大量に必要なときは、これらの素材を使って、PHPなどで案件のフォーマットに合ったインポートデータを生成したりもします。
おまけ:テキスト以外もあるよ!
と、今回はダミーテキストに絞って書きましたが、CMSに必要な素材は文字だけではありません。
画像・PDF・Word・Excelのダミーデータも大量に作成して、どこでも呼び出せるようDropboxに入れています。
画像については、デジカメのフルサイズ、Facebookに最適な1:1.9、正方形、4:3、日本語ファイル名(ファイル名を変換しないMovable Typeなどで必要です)など、各種用意しています。
最近は「Unsplash It」などの自動生成のお世話になることもありますが、テーマを配布する場合はそうもいかないので、自分で撮影した写真のストックを増やしています。
こういった、本来の作業とは直接関係ないものについても、実際の作業時に意識する必要がないくらいに整えておきたいと思っています。