Heliumで簡単ブラウザ自動化

はじめに
1. 実装したいこと
なぜ Selenium ではなく Helium なのか
1. Seleniumとの違い
準備するもの
1. ライブラリ
2. ディレクトリ構成
コードスクリプト
Heliumの注意点
1. 利用時の注意点
まとめ

はじめに

Helium は、Selenium の代替として Python でブラウザの自動操作を行うためのライブラリです。
よりシンプルで直感的な記述が可能であり、Web テストの自動化やスクレイピング、フォーム入力の自動化などに役立ちます。

本記事では、Helium を使ってブラウザを制御する方法を解説し、具体的な使用例を紹介します。
また、Selenium との違いや Helium の 利点・欠点 についても詳しく説明します。

実装したいこと

Web ページの自動操作を簡単に行う

ブラウザ上の要素を直感的に操作する

Selenium よりも簡潔なコードで処理を実装する

なぜ Selenium ではなく Helium なのか

ブラウザの自動操作には Selenium が一般的ですが、Selenium には以下のような課題があります。

コード量が多く、書くのが面倒**（要素を取得するために細かい指定が必要）
CSS セレクタや XPath の知識が必要（直感的に操作しにくい）
環境構築がやや複雑（ドライバの設定や追加ライブラリが必要）

Helium は、こうした **Selenium の煩雑さを解消し、より簡単にブラウザを自動操作できる** ように設計されています。

Seleniumとの違い

Helium は Selenium を簡素化したラッパーであり、以下のような違いがあります。

項目	Helium	Selenium
コードのシンプルさ	シンプルで直感的	より多くのコードが必要
要素検索	名前やプレースホルダーで直接検索	CSSセレクタやXPathを指定する必要あり
ヘッドレスモード	`start_chrome(headless=True)` で簡単に設定	`options.add_argument("--headless")` を設定する必要あり
セットアップの手軽さ	すぐに使える	より多くの設定が必要
カスタマイズ性	簡単な操作向け	高度な操作が可能

Helium のメリット

Helium の最大の魅力は、「コードの記述が簡単で直感的」 なことです。
例えば、Google 検索を実行する場合、以下のように短いコードで記述できます。

🔹Helium の場合

from helium import *

start_chrome("https://www.google.com")
write("Helium Python", into="検索")
press(ENTER)
screenshot("search_results.png")
kill_browser()

🔹Selenium の場合

from selenium import webdriver
from selenium.webdriver.common.keys import Keys

driver = webdriver.Chrome()
driver.get("https://www.google.com")

search_box = driver.find_element("name", "q")
search_box.send_keys("Helium Python")
search_box.send_keys(Keys.RETURN)

driver.save_screenshot("search_results.png")
driver.quit()

Helium は「検索ボックスの取得」などの記述を省略できるため、より直感的に記述可能 です。

Heliumのデメリット

Helium は簡単な操作向けに最適化されていますが、Selenium に比べて カスタマイズ性が低い というデメリットがあります。

例えば：

要素を詳細に指定する場合（XPath, CSS セレクタが必要な場面）
ヘッドレス以外の細かいブラウザ設定を行いたい場合
公式の開発があまり活発でないため、Selenium の最新バージョンに依存する

➡ より高度な自動化を行う場合は Selenium の方が適していることもある ため、用途に応じて使い分けましょう。

準備するもの

ライブラリ

インポート手順

Helium は pip を使用して簡単にインストールできます。

pip install helium

このライブラリの説明

Helium は Selenium の上位ラッパーとして機能し、以下の特徴を持ちます。

シンプルな API：少ないコード行数でブラウザ操作が可能。
直感的な要素検索：CSS セレクタや XPath を意識せずに要素を操作できる。
ヘッドレスモード対応：GUI なしでブラウザを制御可能。

ディレクトリ構成

プロジェクトの基本的なディレクトリ構成は以下のようになります。

helium_project/
├── main.py  # Helium を使用したスクリプト
├── requirements.txt  # 必要なライブラリ

コードスクリプト

以下のスクリプトでは、Helium を使って Google を開き、検索ボックスにキーワードを入力して検索する処理を行います。

from helium import *

# ブラウザを開く
browser = start_chrome("https://www.google.com")

# 検索ボックスに入力して検索
write("Helium Python", into="検索")
press(ENTER)

# 結果ページのスクリーンショットを保存
screenshot("search_results.png")

# ブラウザを閉じる
kill_browser()

実行結果

このスクリプトを実行すると、以下の処理が行われます。

Google のページが開く。
検索ボックスに “Helium Python” と入力。
Enter キーを押して検索。
検索結果のスクリーンショットが search_results.png に保存される。
ブラウザが閉じる。

コード解説

start_chrome("URL")：指定した URL を開く。
write("テキスト", into="入力フィールド")：指定したフィールドにテキストを入力。
press(ENTER)： Enter キーを押す。
screenshot("ファイル名")：スクリーンショットを撮影。
kill_browser()：ブラウザを閉じる。

さらに便利！ヘッドレスモードでの実行

ここまで、Helium を使って簡単にブラウザを自動操作する方法を紹介しました。
しかし、毎回ブラウザが立ち上がると、動作中のウィンドウが邪魔になったり、サーバー上で動かしにくかったりすることもあります。

そんなときに便利なのが、「ヘッドレスモード」です。

ヘッドレスモードとは、ブラウザのウィンドウを開かずにバックグラウンドで処理を実行するモード です。
これにより、以下のようなメリットがあります。

作業の邪魔にならない
ウィンドウが開かないため、他の作業をしながら実行できる
サーバー上で実行できる
GUI のない環境でも動作可能
動作が少し速くなる
レンダリングが不要になるため、処理が軽くなる場合がある

ヘッドレスモードの使い方

browser = start_chrome("https://www.google.com", headless=True)

ヘッドレスモードを有効にするには、start_chrome() に headless=True を指定するだけです。

ヘッドレスモードの注意点

ヘッドレスモードでは 「完全にブラウザが開かない」 ため、以下のようなケースでは動作に影響が出ることがあります。

ポップアップやアラートの操作が難しい
一部のサイトでヘッドレスモードを検知される可能性がある
スクレイピング時に動作しないサイトもある（JS の実行が制限される場合がある）

➡ 通常の操作に問題がなければヘッドレスを使うのがおすすめですが、動作がおかしい場合はウィンドウありで試すのも手です！

Heliumの注意点

Helium は便利ですが、使用する際にいくつか注意すべきポイントがあります。特に、内部で Selenium を使用しているため、環境設定や実行時の制約を理解しておくことが大切です。

利用時の注意点

ChromeDriver が必要
Helium は Selenium を利用しているため、ChromeDriver をインストールしておく必要があります。Chrome のバージョンに対応したものをダウンロードし、適切に設定しておくことが大切です。
ヘッドレスモードの設定
ヘッドレスモードを利用する場合は start_chrome(headless=True) を指定します。ただし、一部のサイトではヘッドレスモードが検知される可能性があり、正常に動作しない場合があります。
スクレイピングの制限
サイトによってはスクレイピングを禁止している場合があります。事前に利用規約を確認し、適切な運用を心がける必要があります。