このツールの機能
この無料オンラインワードクラウドビルダーは、どの単語が最も多く現れるかを表示します—テキストを貼り付け、ワードクラウドを生成をクリックすると即座にワードクラウドが表示。ワードクラウドジェネレーターやタグクラウドとして、スピーチ・記事・一目で要約したいテキストに。大きい単語ほど頻度が高い。登録・アップロード不要。Text Tokenizerと同じトークン化がブラウザ内で実行。最大単語数と最小出現数でクラウドを絞り込める。概要の把握、プレゼン、コンテンツ分析、教育に最適です。
使い方
クイックスタート: テキストから(貼り付けてトークン化)またはリストから(単語と頻度)を選び、入力または貼り付けして「ワードクラウドを生成」をクリック。最大単語数と最小出現数を調整。ホバーで頻度を表示。
- 入力モードを選ぶ — テキストからは貼り付けたテキストを自動トークン化(Text Tokenizerと同じ)。リストからは単語と頻度を手動で入力。1行1件(例:
word 10またはword<Tab>10)。 - 入力または貼り付け — テキストモード:テキストを入力または貼り付け。ダミーテキストを生成で手早く入力。リストモード:1行1件で
単語 頻度のペアを入力。 - ワードクラウドを生成をクリック — ツールが入力を処理してワードクラウドを描画。
- オプションを調整 — 最大単語数(デフォルト80)で表示単語数を制限。最小出現数で低頻度語を除外。
- ホバーで件数 — 単語にホバーするとツールチップで頻度が表示。
動作の仕組み
単語カウントはText Tokenizerに委譲:テキストを空白で分割し、前後の句読点を除き、空文字列を除外して頻度を計算し、件数の降順でソート。クラウドのレイアウトはd3-cloudで重ならないように単語を配置。フォントサイズは頻度に比例。計算はすべてブラウザ内で行われ、サーバーには送信されません。
使用例とサンプル
- 概要の把握 — 文書や書き起こしでどの語が支配的か一目で確認。
- プレゼン — 会議メモや記事からキートピックのビジュアル要約を作成。
- コンテンツ分析 — ブログや顧客フィードバックで繰り返しのテーマを把握。
- 教育 — テキストの語頻度と語彙の分布を図示。
例
入力"hello world hello."の場合:トークンはhello、world、hello。クラウドでは「hello」が2回現れるため「world」より大きく表示される。
制限と既知の制約
- 入力上限 — 最大512KB(約512,000文字)。それ以上はエラー。
- クライアント側のみ — サーバーなし。処理はブラウザ内。非常に大きな入力は一瞬UIが重くなる場合あり。
- 単純なトークン化 — Text Tokenizerと同じで空白分割のみ。ステミング、レンマ化、言語別トークン化はなし。
- 詳細分析 — 頻度表・出力のコピー・「統計で分析」との連携はText Tokenizerを使用。