PHPでBlueskyの埋め込み用HTMLを取得

(1/1)
PHPでツイートの埋め込み用HTMLを取得
Bluesky クライアントの機能として、ホームページやブログに投稿メッセージを埋め込むためのHTML取得機能がある。ところが、Twitter(現・X) と異なり、Bluesky API にこの機能が用意されていない。
そこで今回は、PHPで メッセージ取得用の Bluesky APIを利用し、Bluesky の埋め込み用HTMLを取得するプログラムを作ってみることにする。
(2025年11月21日)PHP8.5対応:curl_close,imagedestroyを実行しないようにした.
(2025年8月17日)画像に余計な空白が入らないようにするため一部仕様変更.
(2025年8月14日).pahooEnv導入

目次

サンプル・プログラムの実行例

PHPでBlueskyの埋め込み用HTMLを取得

サンプル・プログラム

圧縮ファイルの内容
embedBlueskyPost.phpサンプル・プログラム本体
.pahooEnvクラウドサービスを利用するためのアカウント情報などを記入する .env ファイル。
使い方は「各種クラウド連携サービス(WebAPI)の登録方法」を参照。include_path が通ったディレクトリに配置すること。
pahooInputData.phpデータ入力に関わる関数群。
使い方は「数値入力とバリデーション」「文字入力とバリデーション」などを参照。include_path が通ったディレクトリに配置すること。
pahooBlueskyAPI.phpBluesky APIに関わるクラス pahooBlueskyAPI。
使い方は「PHPでPHPでBlueskyに投稿する」などを参照。include_path が通ったディレクトリに配置すること。
pahooScraping.phpスクレイピング処理に関わるクラス pahooScraping。
スクレイピング処理に関わるクラスの使い方は「PHPでDOMDocumentを使ってスクレイピング」を参照。include_path が通ったディレクトリに配置すること。
embedBlueskyPost.php 更新履歴
バージョン 更新日 内容
1.6.0 2025/08/14 .pahooEnv導入
1.0.0 2025/01/18 初版
pahooBlueskyAPI.php 更新履歴
バージョン 更新日 内容
2.7.1 2025/11/22 PHP8.5対応:curl_close,imagedestroyを実行しないようにした
2.7.0 2025/08/17 reductImage,uploadBlob仕様変更←画像に余計な空白が入らないようにするため
2.6.0 2025/08/14 .pahooEnv 導入
2.5.1 2025/08/10 uploadBlob() -- bug-fix
2.5.0 2025/08/02 getOGPInformation() -- og:imageがないページに対応
pahooScraping.php 更新履歴
バージョン 更新日 内容
1.2.1 2024/10/31 __construct() 文字化け対策
1.2.0 2024/09/29 getValueFistrXPath() 属性値でない指定に対応
1.1.0 2023/10/15 getValueFistrXPath() 追加
1.0.1 2023/09/29 __construct() bug-fix
1.0.0 2023/09/18 初版
pahooInputData.php 更新履歴
バージョン 更新日 内容
2.0.1 2025/08/11 getParam() bug-fix
2.0.0 2025/08/11 pahooLoadEnv() 追加
1.9.0 2025/07/26 getParam() 引数に$trim追加
1.8.1 2025/03/15 validRegexPattern() debug
1.8.0 2024/11/12 validRegexPattern() 追加

準備:PHP の https対応

クラウド連携や相手先サイトのデータを読み込むのに https通信を使うため、PHPに OpenSSLモジュールが組み込まれている必要がある。関数  phpinfo  を使って、下図のように表示されればOKだ。
OpenSSL - PHP
そうでない場合は、次の手順に従ってOpenSSLを有効化し、PHPを再起動させる必要がある。

Windowsでは、"php.ini" の下記の行を有効化する。
extension=php_openssl.dll
Linuxでは --with-openssl=/usr オプションを付けて再ビルドする。→OpenSSLインストール手順

これで準備は完了だ。

準備:pahooInputData 関数群

PHPのバージョンや入力データのバリデーションなど、汎用的に使う関数群を収めたファイル "pahooInputData.php" が同梱されているが、include_path が通ったディレクトリに配置してほしい。他のプログラムでも "pahooInputData.php" を利用するが、常に最新のファイルを1つ配置すればよい。

また、各種クラウドサービスに登録したときに取得するアカウント情報、アプリケーションパスワードなどを登録した .pahooEnv ファイルから読み込む関数 pahooLoadEnv を備えている。こちらについては、「各種クラウド連携サービス(WebAPI)の登録方法」をご覧いただきたい。

解説:pahooBlueskyAPIクラス

Bluesky に投稿したりプログラムで操作するAPIについては、公式リファレンスが詳しい。APIを利用するには、事前に、あなたのアカウントから利用登録を行い、アプリパスワードを取得する必要がある。その手順は「Bluesky API - 各種クラウド連携サービス(WebAPI)の登録方法」をご覧いただきたい。
Bluesky APIを利用するメソッドはクラス "pahooBlueskyAPI.php" に分離している。また、このクラスからクラス "pahooScraping.php" を呼び出すので、2つのクラス・ファイルを include_path の通ったディレクトリに配置すること。

解説:セッション開始

BlueskyAPI を利用するには、まずセッションを開き、アクセストークン accessJwt を取得する。使用するエンドポイントは com.atproto.server.createSession だ。
com.atproto.server.createSession
URL
https://{PDSドメイン}/xrpc/com.atproto.server.createSession
リクエスト・データ(http) header Content-Type "application/json" post identifier ハンドル名 password アプリケーション・パスワード
レスポンス・データ(json) accessJwt アクセストークン refreshJwt リフレッシュトークン handle ハンドル名 did did
アクセストークン accessJwt は、後述するメッセージや画像の投稿で使用する。寿命は1~2時間だ。
アクセストークン refreshJwt は、アクセストークンの再発行や、セッションの終了・破棄に用いることができ、寿命は数十日と長い。リフレッシュトークン refreshJwt をストレージに保存しておき、次回はアクセストークンを再発行するというのが BlueskyAPI の望ましい運用方法と思われるが、リフレッシュトークン refreshJwt だけでアクセストークン accessJwt を再発行できてしまうので、流出するとたいへん危険である。

今回つくるプログラムは、単発でメッセージや画像を投稿するものなので、リフレッシュトークン refreshJwt は使わず、プログラム起動時にアクセストークン accessJwt を取得するようにする。

pahooBlueskyAPI.php

  15: // スクレイピング処理に関わるクラス:include_pathが通ったディレクトリに配置
  16: require_once('pahooScraping.php');
  17: 
  18: // Bluesky API クラス =======================================================
  19: class pahooBlueskyAPI {
  20:     public $pds;            // PDSドメイン
  21:     public $webapi  ;       // 直前に呼び出したWebAPI URL
  22:     public $errmsg;         // エラーメッセージ
  23:     public $accessJwt;      // accessJwt
  24:     public $refreshJwt;     // refreshJwt
  25: 
  26:     const INTERNAL_ENCODING = 'UTF-8';  // 内部エンコーディング
  27:     const MAX_MESSAGE_LEN = 300;        // 投稿可能なメッセージ文字数
  28:     const URL_LEN = 23;                 // メッセージ中のURL文字数(相当)
  29:     const MAX_IMAGE_WIDTH  = 1200;      // 投稿可能な最大画像幅(ピクセル)
  30:     const MAX_IMAGE_HEIGHT = 675;       // 投稿可能な最大画像高さ(ピクセル)
  31:                                         // これより大きいときは自動縮小する
  32:     // トークンを保存するファイル名
  33:     // 秘匿性を保つことができ、かつ、PHPプログラムから読み書き可能であること
  34:     const FILENAME_TOKEN = './.token';
  35: 
  36:     // -- 以下のデータは .env ファイルに記述可能
  37:     // Bluesky API アプリパスワード
  38:     // https://bsky.app/
  39:     public $BLUESKY_HANDLE   = '';      // ハンドル名
  40:     public $BLUESKY_PASSWORD = '';      // アプリケーション・パスワード

BlueskyAPI を利用するユーザー定義クラス pahooBlueskyAPIをつくる。
上述の手順で取得したアプリケーション・パスワードをプロパティ変数 $BLUESKY_PASSWORD に、あなたのハンドル名を $BLUESKY_HANDLE に代入する。
投稿可能な最大文字数は定数 MAX_MESSAGE_LEN として用意した。現在の仕様では300文字だ。

pahooBlueskyAPI.php

  42: /**
  43:  * コンストラクタ
  44:  * もしAPIエラーが出る場合には,新規セッションにしてみる.
  45:  * @param   string $pds PDSドメイン
  46:  * @param   bool $newSession 新規セッションにするかどうか(TRUE:新規,デフォルトはFALSE)
  47:  * @return  なし
  48: */
  49: function __construct($pds, $newSession=FALSE) {
  50:     if (isset($_ENV['PAHOO_BLUESKY_HANDLE'])) {
  51:         $this->BLUESKY_HANDLE   = $_ENV['PAHOO_BLUESKY_HANDLE'];
  52:     }
  53:     if (isset($_ENV['PAHOO_BLUESKY_PASSWORD'])) {
  54:         $this->BLUESKY_PASSWORD = $_ENV['PAHOO_BLUESKY_PASSWORD'];
  55:     }
  56: 
  57:     // プロパティを初期化する.
  58:     $this->pds        = $pds;
  59:     $this->webapi     = '';
  60:     $this->errmsg     = '';
  61:     $this->accessJwt  = '';
  62:     $this->refreshJwt = '';
  63: 
  64:     // 新規セッションを開始する.
  65:     if ($newSession) {
  66:         $this->createSession();
  67:     }
  68: }

コンストラクタの引数は PDSドメインで、変数 $pds に保管し、API呼び出し時に参照できるようにした。

pahooBlueskyAPI.php

 360: /**
 361:  * 新規セッションを開始する.
 362:  * @param   なし
 363:  * @return  bool TRUE:成功/FALSE:失敗
 364: */
 365: function createSession() {
 366:     // エラーメッセージ・クリア
 367:     $this->clearerror();
 368: 
 369:     // リクエストURL
 370:     $requestURL = 'https://' . $this->pds . '/xrpc/com.atproto.server.createSession';
 371:     $this->webapi = $requestURL;
 372:     $ch = curl_init($requestURL);
 373:     // cURLを使ったリクエスト
 374:     curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
 375:     curl_setopt($ch, CURLOPT_HTTPHEADER, ['Content-Type: application/json']);
 376:     curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
 377:     curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE); // サーバ証明書検証をスキップ
 378:     curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE); //  〃
 379:     curl_setopt($ch, CURLOPT_POST, TRUE);
 380:     curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode([
 381:         'identifier' => $this->BLUESKY_HANDLE,
 382:         'password'   => $this->BLUESKY_PASSWORD,
 383:     ]));
 384: 
 385:     // レスポンス処理
 386:     $response = curl_exec($ch);
 387: //  var_dump('*createSession');
 388: //  var_dump($response);
 389:     $httpStatusCode = curl_getinfo($ch, CURLINFO_RESPONSE_CODE);
 390:     if ($httpStatusCode !200) {
 391:         $this->seterror('セッションを開始できません');
 392:         return FALSE;
 393:     }
 394:     if (PHP_VERSION_ID < 80500) {
 395:         curl_close($ch);
 396:     }
 397:     $items = json_decode($response, TRUE);
 398: 
 399:     // エラーチェックとリターン
 400:     if (isset($items['accessJwt']) && isset($items['refreshJwt'])) {
 401:         $this->accessJwt = (string)$items['accessJwt'];
 402:         $this->refreshJwt = (string)$items['refreshJwt'];
 403:         // トークンをファイルに保存する
 404:         $contents = $this->accessJwt . "\n" . $this->refreshJwt;
 405:         file_put_contents(self::FILENAME_TOKEN, $contents);
 406:         return TRUE;
 407:     } else if (isset($items['error'])) {
 408:         $this->seterror($items['message']);
 409:         return FALSE;
 410:     } else {
 411:         $this->seterror('セッションを開始できません');
 412:         return FALSE;
 413:     }
 414: }

セッション開始メソッド createSession は、引数はなく、セッション開始に成功したかどうかを戻り値にする。

メソッドの中身は、上述のAPI仕様の通りに作った。
POSTプロトコルとして、これまでのクラウドサービス利用でも使ってきた cURL関数を利用する。

解説:セッション終了

アクセストークン accessJwt のセッションを終了するには、エンドポイント com.atproto.server.deleteSession を呼び出す。
com.atproto.server.deleteSession
URL
https://{PDSドメイン}/xrpc/com.atproto.server.deleteSession
リクエスト・データ(json) header Content-Type "application/json" post identifier "Bearer {アクセストークン}" password アプリケーション・パスワード
セッション開始時に取得したアクセストークン accessJwt を使い、このセッションをクローズする。以後、このアクセストークン accessJwt は使用できなくなる。
アクセストークン accessJwt の盗用を避ける意味で、セッションを開始したら、かならずセッション終了するようにしよう。

APIの戻り値は、httpステータスが200であれば成功、それ以外であればエラー情報が戻る。

pahooBlueskyAPI.php

 472: /**
 473:  * セッション終了する.
 474:  * @param   なし
 475:  * @return  bool TRUE:成功/FALSE:失敗
 476: */
 477: function deleteSession() {
 478:     // リクエストURL
 479:     $requestURL = 'https://' . $this->pds . '/xrpc/com.atproto.server.deleteSession';
 480:     $this->webapi = $requestURL;
 481:     $ch = curl_init($requestURL);
 482:     // cURLを使ったリクエスト
 483:     curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
 484:     curl_setopt($ch, CURLOPT_HTTPHEADER, ['Authorization: Bearer ' . $this->accessJwt]);
 485:     curl_setopt($ch, CURLOPT_CUSTOMREQUEST, 'DELETE');
 486:     curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
 487:     curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE); // サーバ証明書検証をスキップ
 488:     curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE); //  〃
 489: 
 490:     // レスポンス処理
 491:     $response = curl_exec($ch);
 492:     if (curl_errno($ch)) {
 493:         $this->seterror('セッション終了できません' . curl_error($ch));
 494:         return FALSE;
 495:     }
 496:     if (PHP_VERSION_ID < 80500) {
 497:         curl_close($ch);
 498:     }
 499:     $this->accessJwt = '';
 500:     $this->refreshJwt = '';
 501: 
 502:     return TRUE;
 503: }

セッション終了メソッド deleteSession は、引数はなく、セッション開始に成功したかどうかを戻り値にする。

解説:メッセージ情報を取得

メッセージ情報を取得するエンドポイントは app.bsky.feed.getPosts だ。
app.bsky.feed.getPosts
URL
https://{PDSドメイン}/xrpc/app.bsky.feed.getPosts?uris={atURI(複数)}
取得したい複数のメッセージの atURI をGETで渡すことで、一度の呼び出しで複数のメッセージ情報を取得することができる。

APIの戻り値は、httpステータスが200であれば成功、それ以外であればエラー情報が戻る。
レスポンス・データ(json) posts uri メッセージURI(atURI):1つ目 cid メッセージCID author did DID handle ユーザー名 displayName 表示名 avatar アバター画像URL createdAt 登録日時(UTC) record $type "app.bsky.feed.post"(OGP情報) text メッセージ(UTF-8) createdAt 投稿日時(ローカル時刻;ISO 8601形式) embed $type "app.bsky.embed.external" external uri コンテンツURL thumb メディアをアップしたPDSのUR title コンテンツのタイトル description コンテンツの概要 facets index byteStart リンクの開始位置 byteEnd リンクの終了位置 features $type "app.bsky.richtext.facet#link" uri URL index byteStart リンクの開始位置 byteEnd リンクの終了位置 features $type "app.bsky.richtext.facet#link" uri URL replyCount リプライ数 repostCount リポスト数 likeCount いいね数 quoteCount 引用数 uri メッセージURI(atURI):2つ目 cid メッセージCID author did DID handle ユーザー名 displayName 表示名 avatar アバター画像URL createdAt 登録日時(UTC) record $type "app.bsky.feed.post"(OGP情報) text メッセージ(UTF-8) createdAt 投稿日時(ローカル時刻;ISO 8601形式) embed $type "app.bsky.embed.external" external uri コンテンツURL thumb メディアをアップしたPDSのUR title コンテンツのタイトル description コンテンツの概要 facets index byteStart リンクの開始位置 byteEnd リンクの終了位置 features $type "app.bsky.richtext.facet#link" uri URL index byteStart リンクの開始位置 byteEnd リンクの終了位置 features $type "app.bsky.richtext.facet#link" uri URL replyCount リプライ数 repostCount リポスト数 likeCount いいね数 quoteCount 引用数

pahooBlueskyAPI.php

1284: /**
1285:  * メッセージURLからメッセージ情報を取得する
1286:  * @param   array $urls メッセージURL(複数)
1287:  * @return  array メッセージ情報 / FALSE:取得失敗
1288: */
1289: function getPosts($urls) {
1290:     $atURIs = [];
1291:     foreach ($urls as $url) {
1292:         // ユーザー名、投稿IDを取得する
1293:         if (preg_match('/\/profile\/([^\/]+)\/post\/([0-9a-zA-Z]+)/ui', $url, $arr) == 0) {
1294:             $this->seterror($url . 'は投稿URLではありません');
1295:             return FALSE;
1296:         }
1297:         if (count($arr< 3) {
1298:             $this->seterror($url . '投稿URLではありません');
1299:             return FALSE;
1300:         }
1301:         $userName = $arr[1];
1302:         $postID   = $arr[2];
1303: 
1304:         // ユーザーDIDを取得する
1305:         $userDID = $this->getDID($userName);
1306:         if ($userDID == FALSE) {
1307:             $this->seterror($url . 'はユーザーDIDを取得できません');
1308:             return FALSE;
1309:         }
1310: 
1311:         // AT-URIを生成する
1312:         $atURIs[] = 'at://' . $userDID . '/app.bsky.feed.post/' . $postID;
1313:     }
1314: 
1315:     // トークンを取得する.
1316:     $this->getValidToken();
1317: 
1318:     // リクエストURL (認証必要)
1319:     $requestURL = 'https://' . $this->pds . '/xrpc/app.bsky.feed.getPosts';
1320:     $ch = curl_init($requestURL . '?' . http_build_query(['uris' => $atURIs]));
1321:     curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
1322:     curl_setopt($ch, CURLOPT_HTTPHEADER, [
1323:         'Content-Type: application/json',
1324:         'Authorization: Bearer ' . $this->accessJwt,
1325:     ]);
1326:     curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
1327:     curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE); // サーバ証明書検証をスキップ
1328:     curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE); //  〃
1329: 
1330:     // レスポンス処理
1331:     $response = curl_exec($ch);
1332:     $httpStatusCode = curl_getinfo($ch, CURLINFO_RESPONSE_CODE);
1333:     if (PHP_VERSION_ID < 80500) {
1334:         curl_close($ch);
1335:     }
1336:     $items = json_decode($response, TRUE);
1337:     if ($httpStatusCode !200) {
1338:         $errmsg = 'メッセージ情報を取得できません(http code:' . $httpStatusCode . ')';
1339:         if (isset($items['message'])) {
1340:             $errmsg .';' . $items['message'];
1341:         }
1342:         $this->seterror($errmsg);
1343:         return FALSE;
1344:     }
1345: 
1346:     return $items;
1347: }

メッセージ情報を取得メソッド getPosts は、引数に atURI ではなく BlueskyメッセージのURLを配列で渡す。内部でURLを atURI に変換してから BlueskyAPI に渡すようにしている。

解説:埋め込み用HTMLを取得

pahooBlueskyAPI.php

1349: /**
1350:  * メッセージURLから埋め込みHTMLを取得する
1351:  * @param   array $url メッセージURL
1352:  * @return  string 埋め込みHTML / FALSE:取得失敗
1353: */
1354: function getEmbedPosts($url) {
1355:     $items = $this->getPosts([$url]);
1356:     if ($items == FALSE) {
1357:         return FALSE;
1358:     }
1359: 
1360:     // 投稿日時を日本語に変換する
1361:     $createdDateTime = $items['posts'][0]['record']['createdAt'];
1362:     preg_match('/([0-9]{4})\-([0-9]{2})\-([0-9]{2})T([0-9]{2})\:([0-9]{2})/', $createdDateTime, $arr);
1363:     $dt = sprintf('%04d年%d月%d日 %02d:%02d', (int)$arr[1], (int)$arr[2], (int)$arr[3], (int)$arr[4], (int)$arr[5]);
1364:     // 埋め込みHTML生成(公式の出力に合わせる)
1365:     return <<< EOT
1366: <blockquote class="bluesky-embed" data-bluesky-uri="{$items['posts'][0]['uri']}" data-bluesky-cid="{$items['posts'][0]['cid']}"><p lang="">{$items['posts'][0]['record']['text']}<br><br><a href="https://bsky.app/profile/{$items['posts'][0]['uri']}?ref_src=embed">[image or embed]</a></p>&mdash; {$items['posts'][0]['author']['displayName']} (<a href="https://bsky.app/profile/{$items['posts'][0]['author']['did']}?ref_src=embed">@{$items['posts'][0]['author']['handle']}</a>) <a href="https://bsky.app/profile/{$items['posts'][0]['uri']}?ref_src=embed">{$dt}</a></blockquote><script async src="https://embed.bsky.app/static/embed.js" charset="utf-8"></script>
1367: 
1368: EOT;
1369: }

メソッド getEmbedPosts は、メッセージ情報URLを1つ渡すと、前述のメソッド getPosts を利用して、戻ってきたメッセージ情報をHTML形式に成形する。整形テンプレートは、Bluesky 公式が出力するものに合わせた。

参考サイト

(この項おわり)
header