データを集めて遊んでみる

本屋を彷徨っていたら「データを集める技術 (佐々木拓郎著)」という本を発見。衝動買いしました。

f:id:xbancha:20170106005607j:image

Excelやgoogle スプレッドシートの関数を使ってWebサイトから情報収集する方法や、slackやIFTTTを使った情報収集を解説する本です。

すぐ使えるテクニックがまとまってるので手を動かしながら楽しく読めました。

詳しくは本を読んでいただくとして、この投稿では気になった点を一つだけ。

指定したページから任意の要素を取り出せるgoogle スプレッドシートの関数「importxml」。

=importxml(URL,xpath式)

さっとググって出てきたブログでも「xpathをcopyして貼り付けるだけで要素を取得できます」と書いてありますがimportxmlを叩いた結果#N/Aになることがあります。

どうやらxpathをママコピして貼り付けても名前空間が一致しないと要素を返してくれない様子。

「適当な接頭辞をつけたら要素を取れるよ」というブログを見つけたのでまた後日チャレンジします。今日は眠いのでここまで。

欲しかった要素を全ては取得できなかったけど、どうにか取得できた要素を組み合わせて漫画投稿サイトでの運営ピックアップ率向上に役立ちそうなグラフを作ってみました。

一応念を押しますが、あくまで私的な範囲で楽しんでいます。*1

ちなみに、触ればわかる範疇ですがIFTTTはバージョンが変わって本のキャプチャとはUIや操作手順が異なるのでお気をつけください。解説本の宿命ですね。

*1:詳しくは「スクレイピング　訴訟」とかでググってください。

ローグ・ワン/スター・ウォーズ・ストーリーを観た

日記映画

近所の映画館で年始の特別価格(1100円)上映をしていたので、前から気になってたローグ・ワン/スター・ウォーズ・ストーリーを見て来ました。

f:id:xbancha:20170102173207j:image

久しぶりにシンプル&骨太なレジスタンスものを観れて、正月から非常にスッキリした気分です。

チアルートかっこいい。

ただ、後ろのカップルがエンドロール中にべらべら喋り出したのは許さん。

静かに外出るか明るくなるまで黙っとけ。

日記

新年あけましておめでとうございます。

f:id:xbancha:20170101155632j:image

いつも年越しは近場で朝まで飲み明かすのですが、今年は趣向を変えて山梨に行ってきました。

f:id:xbancha:20170101161519j:image

f:id:xbancha:20170101162358j:image

趣きのある店で年越しほうとうを啜り、31日に駆け込みで取ったペンションでガキ使を見ながらダラっと過ごし、朝一で富士山を見て帰ってきました。

今年は漫画をもっとたくさんの人に読んでもらえるよう話作りや露出方法を試行錯誤してみようと思います。

あとは仕事関係の勉強(webマーケティングやら何やら)をちょこちょこやる予定です。備忘録としてこのブログにもまとめるので気が向いたらご一読いただけると嬉しいです。

今年もよろしくお願いします。