読者です 読者をやめる 読者になる 読者になる

二番茶

オリジナルWeb漫画とかインターネットのこととか。

データを集めて遊んでみる

本屋を彷徨っていたら「データを集める技術 (佐々木拓郎 著)」という本を発見。衝動買いしました。

f:id:xbancha:20170106005607j:image

 Excelgoogleスプレッドシートの関数を使ってWebサイトから情報収集する方法や、slackやIFTTTを使った情報収集を解説する本です。

すぐ使えるテクニックがまとまってるので手を動かしながら楽しく読めました。

 詳しくは本を読んでいただくとして、この投稿では気になった点を一つだけ。

 

importxml関数でxpathをママコピ指定したけど#N/Aになる

指定したページから任意の要素を取り出せるgoogleスプレッドシートの関数「importxml」。

=importxml(URL,xpath式)

 さっとググって出てきたブログでも「xpathをcopyして貼り付けるだけで要素を取得できます」と書いてありますがimportxmlを叩いた結果#N/Aになることがあります。

どうやらxpathをママコピして貼り付けても名前空間が一致しないと要素を返してくれない様子。

「適当な接頭辞をつけたら要素を取れるよ」というブログを見つけたのでまた後日チャレンジします。今日は眠いのでここまで。

 

欲しかった要素を全ては取得できなかったけど、どうにか取得できた要素を組み合わせて漫画投稿サイトでの運営ピックアップ率向上に役立ちそうなグラフを作ってみました。

  • 掲載時間と曜日を取得して更新頻度の高いタイミングを探るグラフ
  • 掲載時間とカテゴリを取得してピックアップ率の高いカテゴリを探るグラフ

一応念を押しますが、あくまで私的な範囲で楽しんでいます。*1

 

ちなみに、触ればわかる範疇ですがIFTTTはバージョンが変わって本のキャプチャとはUIや操作手順が異なるのでお気をつけください。解説本の宿命ですね。

*1:詳しくは「スクレイピング 訴訟」とかでググってください。

ローグ・ワン/スター・ウォーズ・ストーリーを観た

近所の映画館で年始の特別価格(1100円)上映をしていたので、前から気になってたローグ・ワン/スター・ウォーズ・ストーリーを見て来ました。

f:id:xbancha:20170102173207j:image

 

久しぶりにシンプル&骨太なレジスタンスものを観れて、正月から非常にスッキリした気分です。

チアルートかっこいい。
 

ただ、後ろのカップルがエンドロール中にべらべら喋り出したのは許さん。

静かに外出るか明るくなるまで黙っとけ。

2017年のご挨拶

新年あけましておめでとうございます。

 

f:id:xbancha:20170101155632j:image

いつも年越しは近場で朝まで飲み明かすのですが、今年は趣向を変えて山梨に行ってきました。

 

f:id:xbancha:20170101161519j:image

f:id:xbancha:20170101162358j:image

趣きのある店で年越しほうとうを啜り、31日に駆け込みで取ったペンションでガキ使を見ながらダラっと過ごし、朝一で富士山を見て帰ってきました。

 

今年は漫画をもっとたくさんの人に読んでもらえるよう話作りや露出方法を試行錯誤してみようと思います。

あとは仕事関係の勉強(webマーケティングやら何やら)をちょこちょこやる予定です。備忘録としてこのブログにもまとめるので気が向いたらご一読いただけると嬉しいです。

 

今年もよろしくお願いします。

魔女の釜でサンドウィッチを - #38 同時進行

オリジナルWeb漫画「魔女の釜でサンドウィッチを」の第38話。

カヴンの野営地から逃げた砂魔女、虹魔女、ウナ。

f:id:xbancha:20161230095319j:plain

続きを読む

魔女の釜でサンドウィッチを - #37 囮

オリジナルWeb漫画「魔女の釜でサンドウィッチを」の第37話。

妖婆を連れ戻すためカヴンの野営地に忍び込んだ黒魔女。

f:id:xbancha:20161227221957j:plain

続きを読む