スポンサーサイト

一定期間更新がないため広告を表示しています

スポンサードリンク | - | | - | - | - | - |

Octopressを試し中

最近、Markdownで文章を書くのに慣れてきました。
ということで、ブログをMarkdownで書けないかなぁと思い、TLの人たちのブログを見たりしていると 「Octopress」というキーワードがあるじゃないですか。
ということで、Github Pages作って、Octopressを使ってブログを書いてみました。
こちらです。

独自ドメインは昨年から使っているものがあったので、ついでに独自ドメインの設定もしてみました。
ケチなので、.comなどではなく、.infoですが。。。

ということで、徐々にOctopressに移行していこうと考えているところです。
こちらのブログも当面は残しておく予定です。(有料会員は解約して、広告が出る形になると思いますが。。。)

Octopressでこんなの便利だよとかアレば教えてもらえると助かります。
johtani | misc | 11:53 | comments(0) | trackbacks(0) | - | - |

オープンソースへの貢献のススメ

録画してたEテレのスーパープレゼンテーションを見ててふと書きたくなったので、書いてます。
あとから読んだら恥ずかしくなりそうだけど。。。
「"知力の余剰"が世界を変える」というClay Shirkyさんの話を見て思ったことです。
社会的に貢献できる仕組みが最近増えているという話の内容でした。そこで、OSSについても同じことが言えるよなぁと思った次第でして。

昔からいろんなかたが言ってると思うし、今さら何をとおもわれるかもしれないですが、なんとなく書きたくなってしまったので。

私はシステム開発を生業にしています。特にOSSにはお世話になっています。
実際に、OSSを利用している方はかなりいると思います。
幸いにも、私はOSSのコミッターもやっています。
OSSに色々と関わってきて常々思っていることがありまして。

OSSは基本は有志の方々が開発やメンテナンスを行なっています。(最近では会社で行なっているところもありますが。)
そんなOSSに貢献する方法はいくつかあるのかなぁと。

バグを発見したら報告したり、こんな機能を作ってみたけどどうですか?とパッチを送ってみたりするのは素晴らしい貢献だと思います。
ただ、なかなかアクションを起こすのって勇気がいるかなぁと。
実際、私もパッチ書いたりバグ報告するのは気後れすることがありしました。
ただ、貢献する方法ってこれだけじゃないよなぁと、コミッターをやり始めて思いました。

もちろん、バグ報告してもらえるともっとありがたいですし、新機能とかリクエストを送ってもらえるともっと嬉しいです。
MLに質問するのもありです。ただ、ちょっとハードルが高いと思うこともあります。

そんな時は、ただ使っているよと、ツイートしたりブログを書いてくれるだけでもありがたいし、ヤル気が出るものです。
使い勝手が悪いなぁというツイートでも、なんでこんなに使いにくいんだというブログでもいいんです。
気になるなぁという形でもいいと思っています。
githubでフォローするだけでもいいかと。
反応があれば、使ったり触ってもらえていることがわかります。
なので、使っているよとかアピールしてもらえると嬉しいよなぁと。

なんか、締りのない感じになっちゃいましたが、反応があるとうれしいので、お気楽に反応しましょうよというお話です。

johtani | misc | 01:12 | comments(0) | trackbacks(0) | - | - |

あけましておめでとうございます+会社のブログ更新

あけましておめでとうございます。(もう5日ですが。。。)
今年もlucene-gosenを中心に色々と記事を書いていきますので、ツッコミ、コメント待ってます。

たまには会社のブログを書かないとイカンということで、会社のブログにNearRealTime検索についての記事をアップしました。
読んでやってください。


ということで、今年もいろんな勉強会に出没しますので、よろしくお願い致します。
johtani | misc | 12:56 | comments(0) | trackbacks(0) | - | - |

今年の振り返りと来年の抱負?

他の方たちよりひと足はやいですが、今年の仕事が終わりました。
せっかくブログを始めたので、振り返りと来年の抱負など書いてみようかなと。

今年の振り返り
まずは、今年1年を振り返ってみます。
今年の出来事はこんな感じでした。

  • 3月に仕事が一区切り
  • lucene-gosenに参加
  • ブログを始める
  • 色々な勉強会に参加
  • Twitterでつぶやきまくり
  • Mac Book Airの購入
  • PSVita買いました

3月に一昨年から参加していた仕事が一区切りつきました。
もう少し色々とやり残した感がある中で区切りがついたのが少し心残りでした。
あと、3月は震災もあり、色々と大変でした。ただ、自分の中では震災の記憶が少し薄れつつあるのが気がかりです。
良くも悪くも忘れて行ってしまうのだなと。今でも頑張っている方々もいるので、少しでも心に留めておきたいものです。

個人的に一番大きな今年の変化は「lucene-gosenへの参加」です。
関口さんとここ数年ずっと仕事をご一緒させていただいていることもあり、コミッターとして参加させてもらうことが出来ました。
英語が苦手な中、Robertさんへ自己紹介のメールを書いたり、Issueを英語で書いたりと苦労もしていますが、OSSに参加できることがとても楽しいです。
また、使っていただいている方たちからのフィードバックもいただけているのがすごく励みになります。
やはり、OSSは使ってもらってさらに良いものになっていくのかなぁという感想です。
ただ、自分の腰が重いため、なかなか対応が遅かったりといったところもあるなと反省するところも。

勉強会にも色々と参加しました。Solr勉強会を始めとして、かねてより興味があるHadoopのカンファレンスやソースコードリーディング。MongoDBの勉強会やDSIRNLPといった少し研究よりの勉強会にも参加しました。
Solr勉強会に参加してきた経験もあり、他の勉強会にも気負わずに参加できたので本当にSolr勉強会には感謝しています。
おかげで、社外のいろいろな方と話ができ、様々な刺激をうけることが出来ました。

勉強会以外にもTwitterで色々な方に絡みまくったのもまた社外の方とのつながりが出来るいい機会でした。
Twitter依存症じゃないかというくらい、つぶやいたり、人に絡んだりしてます。。。(迷惑だったら言ってください。)
お陰で@doryokujinさんや@wyukawaさんが主催してくれたログ解析の飲み会に誘ってもらえたり、@nobu_kさんや@ IjokarumawakさんにSolr勉強会で講演してもらえたりしました。
あと、Twitterを通じて勉強会やHadoop関連の情報、lucene-gosenへのフィードバックなどももらえていてかなり助かってます。
@yusukeyさんや@repeatedlyさんに遊んでもらってるのも楽しいですw

最後の大きな変化はApple製品の購入でした。
これまでもブログで書いてきましたが、私は今年の中頃までアンチApple派でした。
それがここ半年足らずでAir、Mini、iPadと3つのApple製品に囲まれています。
Emacsのショートカットが使えるのが最大の要因ですが、何ごとも毛嫌いせずためしてみるのがいいなと思いましたね。
今では、Windowsで開発したくないくらいになってきています。

2012年の抱負
さて、来年の抱負です。
今年いくつかチャレンジしようとして挫折してるものがあります。

  • MongoDB触ってみる
  • Scala触ってみる
  • なんかWebサービス作ってみる(Amazonとかで)
  • elasticsearch、IndexTankを調べてみる
  • NewSolrCloudDesignを読み込んで自分なりにまとめる
  • Junsaiに参加する
  • 「7つの言語7つの世界」の続き

最初の3つはセットですかね。コップ本買ったり、NoSQLの本を買ったりしてるのですが、手付かずです。。。
電子書籍の検索サービスでもつくってみようと思いつつ、腰が重い状態です。
来年は余裕を見ながらちょっとずつやりたいですね。

elasticsearchやIndexTankは仕事がらみです。
Solr入門を書いたこともあり、検索関連には興味があります。
Solrだけでも2ヶ月おきに新バージョンがリリースされたり、4.0系でいろんな機能が実装されているのですが、それ以外にもOSSの検索サーバがいくつかあります。
気になってはいるものの英語が障壁でなかなか手を出して来ませんでした。
来年はSolr以外についてももう少し知識をつけていきたいです。
個人的ですが、分散処理にも少々興味を持っています。
慣れ親しんでいるSolrでもSolrCloudという壮大な計画が上がっていて、少しずつ実装もされています。
ブログでWikiページを翻訳してもみたのですが、翻訳に注力しすぎて理解ができていないです。
このあたりをもう少し理解しつつどのような実装がされているかも調べたいところです。

JunsaiはSolr入門の著者である武田さんが最新のMeCab(今はMeCabが新しくなってしまったので、少し前のMeCabになってしまいました)をJavaに移植したプロジェクトです。
今年頭のSolr勉強会でお披露目があり、私も一応参画しているのですが、手が出せていない状態です。
lucene-gosenで少しは経験を積んできたので、その部分を生かしつつ、こちらももっと活性化させたいところです。
最後は夏ごろにやっていた「7つの言語7つの世界」の再開です。序盤で止まってしまっています。。。
新しい技術に触れる題材としてちょうどよいので、余裕をつくって続きを再開します。
なんか、抱負と言うよりも積み残しですね。。。
他にもTwitterで情報を仕入れるとやりたいことも変わってくるかもしれませんが、それも含めてブログに少しずつでも書きためていこうと思います。

先ほども書きましたが、今年はTwitterを通じて色々な方たちと知り合いになれた一年でした。
ここには書ききれていませんが、フォローしてもらっている方々や勝手に絡んでも相手をしてくれている方々に感謝しています。
今後も絡みますのでよろしくお願いしますw
あと、様々な勉強会に今後も顔を出していくので、かまってやってください。
続きを読む >>
johtani | misc | 02:15 | comments(0) | trackbacks(0) | - | - |

Splunk Live!のイベントに行って来ました。

Solr本の武田さんから教えていただいたSplunkの イベントに行って来ました。
Splunkとは様々な機器のログなどを一箇所に集めてリアルタイムに検索、分析できるようにするための製品です。(ざっくりした説明ですが。。。)
ちなみに、データ量が小さければフリー版も用意されています。
以前、話しを聞いていて気になっていた所イベントが開催されるということだったので参加してきました。
以下に、その時取ったメモを記載しておきます。いつものごとく、自分用のメモなので、役に立つかはわかりませんが。

Splunk Live! in toyosu

日時:2011/11/02 10:00-12:00
場所:豊洲

1.挨拶+アジェンダ紹介
2.ビッグデータ取り込み、ロードマップ(Splunk Inc.)CEO Godfrey Sullivan
 英語でした。。。  データの種類と量が大きくなってきてるのに、ツールが追いつかないし、回答するのもはやくしろと言われる。  非構造化データの例としてApacheのログが出ていた。  TimeSeriesのフラットファイルがsplunkのデータのインデックス。(No RDB=スキーマいらないよと。)    ※ここが重要な点かもしれない。  リアルタイムに解析できるのが売り。Jubatusとの違いとか聞くと面白いかも。  Machine Data Engine=Splunk  データの関連付けの方法がどんなものか?  事前のスキーマが不要=流しこむ前には定義が必要?だよね?  ?No need to filter/forward??  デベロッパーフレームワークってなんだ??  Splunkbaseと呼ばれる場所にSplunk Appsと呼ばれるアプリケーションがある。色々な場所、OS、アプリで利用できるものらしい。  ?自動監視も学習する仕組みがある??  それとも定義するのか?  あくまでもMachine Dataと言っている。これは、ユーザのリレーションの解析などはないということか?  Leading Social Gaming Company=Zynga  Introscopeのログバージョンに似てるかもなぁ。  Cloudベースのアプリの解析にも利用(saleforce)  色々な利用シーンのお話。 3.適用事例(独立行政法人理化学研究所)  和光と神戸で利用。10G程度のデータを扱ってる?  ログから情報基盤を監視するのに利用している。  syslogベースでsplunkにログを送信している。  事例1:VPNに接続できない(接続数上限がある?)   CISCOのログから解析   どの研究室で発生しているかも検索。  事例2:DHCPの接続ミス?(IPアドレスロスト)   ここまでは問題が発生してからログを漁るという使い方。  事例3:LINK FLAPのアラート   短時間にUPDOWNを繰り返す場合にスイッチがおかしくなってるんでは?  事例4:メール大量送信(ウィルス感染)   不特定多数のサーバに短時間でメールを配信している  ※使い方としては情報基盤環境すべて(ネットワークとかサーバなど)のログを集めておいて監視+解析に利用して障害対応などに利用している?データセンターとかに入れるのか?  あくまでも、ログを保存して、検索できる仕組みが1箇所にまとめられているという感じ。  そのログの解析について(どういった問題に対して、どういったクエリを投げるか?どういったトラップを仕込むか?)は利用する側の腕にかかっている印象。  ※実際に触ってみたいなぁ。500M/dayか。ご近所に入れてみるか?syslogで転送設定+入れるサーバが必要。 4.最新アプリなどの紹介(Splunk Inc.)  GUIがきれいだなー(最近のgoogleっぽいが。。。)  リアルタイムにデータが入っているのが見えるのか。おもろいな。  どこのフィールドにヒットしたかがファセットで表示できるらしい。おもろい。  flashでできたビューがすごくおもろかったぞ。(ドキュメントどこだ?) 5.最新の取り組み(NTTデータ先端)  やっぱり武田さんだった。  複数の監視システムのメッセージを統合して検索、アラートを出せるようにする。  消費電力を算出するためにログを集めて集計する。 6.QA  ロードマップ   ・2年以内にビジネスサイドでの利用に向けての動きを見せていく予定。   ・アプリケーションフレームワークにして、他のパートナーのアプリを載せていきたい。
ということで、感想ですが、事例紹介などを聴いた感じだと今のところはインフラ系のログを一元化して検索、監視、アラートをあげるということに活用するためのツールの用に感じました。
当初の使い方がそういったところにあるためだとは思いますが。
開発者としての視点で話しを聞いていて、活用できそうだというのは次のシーンでしょうか。
  • 開発時の開発環境のログ集約
  • 性能試験などでのログ、性能データ集約

開発時点もしくは性能試験時ですが、色々なサーバ(DBやアプリサーバ)の時間を横串にして表示検索などができると思うので、問題があった時の各種サーバの状態を一元的に見れるため、どのサーバにどういった負荷がかかっていたか、 どこに問題があったかなどをグラフ化して見ることが簡単にできるのではないかなぁという感想です。
あとは、ログが一元化されているので、問題があったときにまずログを検索すればいいのが楽ですかね。

基本的にはログが集まってるからあとは、どう使うかはご自由にという印象でした。
どのようなログを集めておき、どういったトラップでアラートさせるか、どのような検索をすれば望んでいるログが出てくるか、どのような集計をしたいかなどについては、やはり導入してからノウハウを貯めていくか、導入時にコンサルしてもらうなどが必要かと。
また、このツールを入れることでどのようなフィードバックをどのように活用できるかをイメージしていなければ、 宝の持ち腐れになりそうです。
あとは、使い方次第ですが、サーバログ以外にアプリログ(ユーザの行動履歴とか)などを入れることで、インフラ以外での使い道もありそうです。
とりあえず、保存しておいて、あとから特定の傾向を見出すのに検索できるのはちょっと面白いかも。

あ、そうそう、ストラップとUSBメモリ(4G)のノベルティをお土産にもらいました。無料セミナーなのに。
johtani | misc | 16:00 | comments(0) | trackbacks(0) | - | - |

Bookscanを使ってみました

Bookscanというサービスがあります。
書籍を電子化(PDF)して原本を破棄してくれるサービスです。

電子書籍にはずっと興味を持っていました。
技術書を購入するのですが、技術書は300ページ超の大きな書籍が大半です。
また、日本語の技術書については、なかなか電子書籍が見つからないもしくは、電子化されるのが遅いとうのが現状です。
海外では、Manningなど、電子書籍も同時に発売(もしくは、製本前から電子書籍が売られている)サイトがありますが、やはり英語の書籍はハードルが高いなぁと。

そんな中、Bookscanの噂を耳にしました。
ということで、どんどん、積ん読になっていく技術書だったので、思い切って、電子化してみることにしました。
※残念ながらまだタブレット(電子書籍端末)は持っていないのですが。。。もうすぐ発売されるlenovoの7inchタブレットを待ちかねているところです。

Bookscanでは、1冊100円で書籍をPDFにしてくれます。(ページ数により変わってくる)
この場合、あくまでも書籍をスキャンするだけで、検索などはできません。
OCR処理については別途1冊100円(これもページ数による)のオプションが必要になります。
詳しいサービス内容はこちらを御覧ください。
基本的には書籍をBookscanに発送してから約3ヶ月ほど電子化するのに時間がかかります。
これでは、すぐに見たい場合に手元にないという状態になってしまいます。
この電子化までの時間を短くできる、「プレミアム会員」というオプションが存在します。
月額固定の費用(9980円)を支払うことで、50冊(※ページ数により1冊の単位が異なります)まで無料で、「スキャン+OCR+書籍名をファイル名」のPDFファイルを書籍到着後1週間以内で作成してもらうことができます。
また、プレミアム会員は月単位での契約が可能なようで、1ヶ月(=50冊)だけ早く電子化してもらうといった利用方法もできるようです。

で、実際にプレミアム会員となって49冊の書籍を送付して電子化してもらいました。
先週金曜日に発送、Bookscanに書籍が到着したのが翌土曜日、電子化が完了したのが火曜日の夜という感じでした。
すごくはやい!かなり感動してます。自炊自体をしたことがないので、出来上がりが自炊と比べてという比較はできないのですが、ざっと見ている感じでは全然問題なく読めそうです。

ただ、1冊の2ページだけ、ページの端が文章の途中で切れているPDFがありました。
この書籍に関しては、サポートサービスにお願いして、再スキャンをしてもらいました。
昨日夜に頼んで今日の午後には問題なく電子化されているというサービスの質でとても満足しています。
なお、原本の破棄が電子化後から10日後に行われるため、問題ないかの確認はそれまでに行う必要があるようです。
大量の本を送る場合は小分けに送ったほうが確認するのが楽になると思います。(送料は小分けにした分、かかってしまいますが。)

書籍の山になっていた机がすっきりして、とても満足しています。
せっかく電子化したので、早くタブレットが欲しいなと思う今日この頃。。。
基本的には今後は電子書籍を購入するようにしていく予定なので、プレミアム会員を継続することはないと思いますが、 家に溜まっている漫画を電子化するのもありかなぁと思っているところです
漫画の場合はOCRに掛ける必要もないですし。

個人的にはBookscanさんには悪いのですが、もっと電子書籍が増えると助かります。
技術書はページ数が多く、重たいうえ、実際に利用するときは検索したくなることが多々ありますので。
あとは、電子書籍を検索できるサイトがあるといいなと思ってもいるところです。
現在は、各出版社が個別に電子書籍のHPを持っている状況で、会社によっては検索すらできないです。
電子書籍があるかないかだけでも簡単に検索できると、いいなと思っています。(小説などはまた別なのかもしれないですが。)
みんなはどう思ってるんですかねぇ?検索したくないですか?
johtani | misc | 18:11 | comments(0) | trackbacks(0) | - | - |

ブログはじめます

今さらですが、ブログをはじめてみようかと。今さらですが…

はじめてみようと思った一番の理由は、自分で調べたことをメモがわりに残すためです。
あとは、自分を追い込むためもありますが。(こっちが一番の理由かも)
最近勉強してないなぁと感じているので。

ということで、まずは、lucene-gosenやsolrについて書いていく予定です。
johtani | misc | 11:44 | comments(0) | trackbacks(0) | - | - |
1/1PAGES | |

09
--
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
--
>>
<<
--
PR
RECOMMEND
[改訂新版] Apache Solr入門 ~オープンソース全文検索エンジン (Software Design plus)
[改訂新版] Apache Solr入門 ~オープンソース全文検索エンジン (Software Design plus) (JUGEMレビュー »)
大谷 純,阿部 慎一朗,大須賀 稔,北野 太郎,鈴木 教嗣,平賀 一昭
Solr 4系に対応した改訂版を出しました!興味ある方はぜひ。
RECOMMEND
Apache Solr入門 ―オープンソース全文検索エンジン
Apache Solr入門 ―オープンソース全文検索エンジン (JUGEMレビュー »)
関口 宏司,三部 靖夫,武田 光平,中野 猛,大谷 純
RECOMMEND
RECENT COMMENT
  • ポモドーロ回してます。(ポモドーロテクニック入門読みました)
    おーたに (05/07)
  • Lucene 4.3.0のChangesにあるChanges in backwards compatibility policyが気になったので訳してみた。
    おーたに (04/26)
  • メインMBAをMountain Lionにアップデート(いろいろ確認中)
    おーたに (09/04)
  • メインMBAをMountain Lionにアップデート(いろいろ確認中)
    m_nori (09/03)
  • メインMBAをMountain Lionにアップデート(いろいろ確認中)
    おーたに (09/03)
  • メインMBAをMountain Lionにアップデート(いろいろ確認中)
    ho4kawa (09/03)
  • メインMBAをMountain Lionにアップデート(いろいろ確認中)
    おーたに (09/03)
  • メインMBAをMountain Lionにアップデート(いろいろ確認中)
    まろか (09/03)
  • Lucene/Solr 3.6.0リリース / 「Apache Solr入門」のサンプルのKuromojiとlucene-gosen対応(1章)
    おーたに (08/07)
  • Lucene/Solr 3.6.0リリース / 「Apache Solr入門」のサンプルのKuromojiとlucene-gosen対応(1章)
    moco (08/07)
RECENT TRACKBACK
MOBILE
qrcode
OTHERS