読者です 読者をやめる 読者になる 読者になる

論文:Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement Learning

モデルフリー系の深層強化学習の手法を用いてスマブラDXのゲームAIを作ったという論文が出ていたので読んだ。以下はそのメモ。 概要 論文URL : https://arxiv.org/abs/1702.06230 著者のグループは github でコードを公開しており、そのデモ動画が twitch や…

読書メモ:Drones: The Facts, Fun & Dangers of Drone Technology

最近のドローン事情について知りたくなったのでいろいろ調べていたらこれを見つけたのでとりあえず読んだ. www.amazon.co.jp 概要 昨今はドローン市場が盛り上がっているが,どのような分野でドローンが活用されているのか,または活用されると期待されてい…

ニューラルネットのメモリ消費を小さくする類の手法

ちょっと前に論文読んだので備忘録としてメモしておく. 前置き 本格的なニューラルネットはパラメータ数が多いのでモデルサイズが大きくなってしまうことが多い http://arxiv.org/pdf/1510.00149v3.pdf によると,"For example, the AlexNet Caffemodel is …

2014年度振り返り

働き始めて1年位経ったっぽいので去年度の振り返りでもします. 仕事 PFIに入社していたのですが入社して半年くらいで PFN (Preferred Networks) という新たに立ち上げた関連会社に移籍しました.環境自体はそこまで大きく変わってません. 仕事で表に出せる…

情報オリンピック春合宿で講義しました

1週間前の出来事ですが「機械学習とその理論」というタイトルで講義しました.大体 PAC 学習の話してます.スライドを公開しているので以下にそのリンクを載せます. 機械学習とその理論 (情報オリンピック2015春合宿講義資料) from irrrrr 今回の講義では,…

ラグランジュ関数の背後にある理論 (Boyd本5章概要)

ラグランジュ関数は以下のような形をした制約付き最適化問題を解くために導入される有名な手法です. $\min_{x \in D} f_0(x),$ $\mbox{subject to}$ $f_i(x) \le 0$ $(i=1,2,...,m)$ $h_i(x) = 0$ $(i=1,2,...,p)$ ここで,$D \subseteq \mathbb{R}^n$ は目…

PFIセミナーで「ICALP参加記」について話しました

先週木曜(2014/8/7)のPFIセミナーで表記のタイトルで発表したので,その資料を公開します. 7月にコペンハーゲンで開かれた理論計算機科学の学会に行ってきたときの話を雑多に書いています.僕が会議に参加した時の発表スライドも公開しています. 余談 本日…

ICALP 2014 に論文採択されました

M.Kusumoto, and Y.Yoshida . "Testing Forest-Isomorphism in the Adjacency List Model." ICALP 2014, to appear.修論の成果で投稿した論文が国際会議のICALP2014に採択されました. ICALP(International Colloquium on Automata, Languages and Programmi…

2013年を今更振り返る

2014年になってからだいぶ経ちましたが2013年の進捗を振り返ろうかと思います. プログラミングコンテスト絡みのことはTopCoder部の方に書いたのでそっちを御覧ください. 卒論の成果をジャーナルに出した Kusumoto Mitsuru, Yuichi Yoshida, and Hiro Ito. …

最近点対問題の線形時間乱択アルゴリズム

これは Competitive Programming Advent Calendar Div2013 の 20 日目の記事です.最近点対問題の話をします.最近点対問題は,空間上に点の集合が与えられた時に,その中で最も距離が近いペアを探す問題です.応用としては,何らかのオブジェクトを特徴ベク…

FOCS2013読み会

11/2にFOCS2013読み会に参加してきたのでその要約を書いてみます.FOCSは理論計算機科学のトップ会議の1つです.※なんか理解が浅かったり間違えたまま把握してたりしてテキトーなことを書いてしまっているかもしれませんがご了承ください. Learning Sums of…

Lindström-Gessel-Viennot lemma

エントリのタイトルの定理について.天下一プログラマーコンテスト2013に出題された問題で知ったのでメモする. ざっくり言うと「平面グラフ上でソース頂点集合とシンク頂点集合が指定された時,vertex-disjoint なパス集合の個数を行列式で計算できるように…

ここについて

なんか最近アウトプットが全然無いなぁと思ったのでなんか書くことにします.

PFIセミナー 2013/9/5

9/5にあったPFIセミナーで発表しました. 無向グラフの隣接行列の固有値・固有ベクトルと,元の無向グラフのパラメータ(グラフの直径とかカットサイズとか)を関連付ける話です. 入門的なことと,どういう応用があるのかについて書いています. 発表は理論か…