アルゴリズム忘備録

競技プログラミングとかデータ分析とか

スライド最小値

蟻本を見ているとあまり知らないアルゴリズムが結構あったりするので、ちゃんと読み返しています。というわけでスライド最小値のメモ。

 

長さNの数列 a[i] に対して、長さkの連続部分列 {a[i], a[i + 1],... , a[i + k - 1]} の最小値を b[i] とします。この b[i] を 0 <= i <= n-k を満たすすべての i についてO(N)で計算できるテクがあります。

 

通常区間最小を高速に求めるにはSegment Tree等を使ってO(Nlog(N)) になります。ただ、Segment Treeは定数倍が遅いので高度な計算が必要ない場合は次のスライド最小値を使うほうが早いです。

 

まずDeque(Qとする)を用意します。このQに対し、a[i]を次のようにpushします。

1. Q の末尾からみていって、a[Qの末尾の要素] < a[i] となるまで Q の末尾をpopする

2. Qにi (値のa[i]ではなく、インデックスのi) をpush する

3. Qの先頭の要素 == i - k ならば先頭の要素を削除する

 

このQの要素をQ[i] とおくと、直感的に言えば、a[i]の長さKの連続部分列の中の単調増加(連続とは限らない)部分列のインデックスが入っている感じです。正確には次のようなQueueになっています

 

1. Q[0] < Q[1] < ... < Q[Qの最後]

2. a[Q[0]] < a[Q[1]] < ... < a[Q[Qの最後]]

3. Qの長さはK以下

 

そのため、今見ている区間でのb[i]はQ[0]で取得できます。Qの削除は追加した数N以上には発生しないため、計算量はO(N)となります。

円周率チャレンジ

円周率チャレンジ

 

平方根を取る or 2を足すを繰り返してπ=3.1415...に近い値を生成してくださいというゲームです。上位はスコアinfがでていますが、これはdouble型の最大値を超えてしまったためのようです。

 

戦略としてはTwitterでも一部言われていますが半分全列挙という手法を使うのが良いのかなと思います。最短手数がランキングからわかっているのでそれをnとおくと、x=0 から始めて2を足す or 平方根を取る という操作をn/2回繰り返した状態を生成します。次にx=πから始めて2を引く or 二乗する という逆操作をn/2繰り返した状態を生成します。そして、両者をつなげて最適解を探索します。ただし、両者の状態はdouble型のため実際には完全には一致しません。そのため、二分探索やしゃくとりなどの方法により最も近いところかその次辺りまでを試して最適なものを発見します。

 

計算量はO(2^(n/2))であり、n=53 ということがわかっているので、空間計算量、処理計算量ともにO(1億)といったところです。競技プログラミングの一般的な制限2秒 1024MB では計算は難しいですが、制限時間等があるわけではないので効率的なコードがかければ無理ではない範囲かと思います。

 

※ネタバレはどうかなとは思うのですが、ネット上ではすでにこのぐらいのネタが書いてある かつ コードを載せているわけではないのでまぁいいかなと。

「ブロックチェーンという言葉に騙されないために」を読もう。

最近会社のSNSに競プロ関係の記事は書いていたので更新は止まっていたのですが、こっちも再開しようかなと。というわけでいもす研の「ブロックチェーンという言葉にだまされないために」の紹介です。

 

https://imoz.jp/note/blockchain.html 「ブロックチェーンという言葉にだまされないために」

 

2016年に書かれた内容ですが、今のブロックチェーン界隈の人はまず一読すべきものだと考えています。(余談ですがこの著者は競プロで有名な人だったりします)

 

この記事を書こうと思ったのはFacebookに貼ってあった次のネタを見たためです。

crypto.watch.impress.co.jp

 

上のネタは今の日本企業におけるブロックチェーンの適用に関わる問題の典型例といってもよいものです。(海外企業でも同様のことがあるかもしれませんが、よく調べてはいません。) ブロックチェーンでなにかビジネスを考えるときに、そもそもブロックチェーンで何を解決するのか、と問うと以下の2点が挙げられることが多いです。

  • トレーサビリティ
  • 改ざん防止

例えばImpress Watchの記事でいうとオープンバッジに盛り込むデータが改ざんされては困るので、そうした視点でブロックチェーンの利用が見込める」という発言に現れています。

 

しかし、いもす研の記事でも触れられていますが、そもそもブロックチェーンで改ざんが困難になるというのはブロックチェーンの主要な特徴ではなくどちらかというと電子署名によるものです。また、トレーサビリティについてもそれが主要な目的ではありません。ブロックチェーン、特にパブリックブロックチェーンが解決する技術的課題は「信頼できないノード間での合意形成」になります。これが必要でないシチュエーションに無理にブロックチェーンを適用しようとしても結局分散DB等の既存技術のほうがよっぽどマシなのですが、そのあたりの認識が薄く上っ面の特徴だけが独り歩きしている印象があります。

 

また、プライベートブロックチェーンについてはそもそも「信頼できないノード間」というのは有名無実化されており、いもす研の引用をしますが、プライベートブロックチェーンとして有名なHyperledgerなどでは「中央管理者がいないことを定義にしているのにもかかわらず、結局実用には中央管理者のいる構造が必要であるとしている点に問題があります。」という状況です。

 

というわけでブロックチェーンについてはインセンティブモデルや合意形成などのいろいろな概念を理解した上で適切な利用法を決めることが重要なのですが、そういう基礎概念を無視して上っ面の特徴だけでビジネス適用する例がかなり多いので気をつけたいところです。

 

ブロックチェーン関係のまとも、かつお手軽に読める記事は実はあまりなく、お手軽なところは上っ面の特徴を列挙してるだけだったり、ちゃんと書いてるところはしっかり書きすぎて一読するには辛いものが多かったりするのですが、いもす研の記事はかなり良く出来てるので必読かと思いました。

 

 

C: 3 Steps - CODE FESTIVAL 2017 qual B | AtCoder

code-festival-2017-qualb.contest.atcoder.jp

 

グラフが与えられる。辺をちょうど3回通ってたどり着ける2点間に新たに辺を引く、という操作をできるだけしたい。ただし、既に辺がある場合は引くことができない。最大で何回操作ができるか?

 

グラフが二部グラフでないとき、頂点間の経路は操作を繰り返していくことで、すべての2点間で3回通って辿り着ける。そのため、完全グラフの辺の数から既に引かれている辺の数を引けばよい。

グラフが二部グラフの場合、最大で完全二部グラフにしかならない(偶奇を考えればよい)。そのため、完全二部グラフの辺の数から現在引かれている辺の数を引けば良い。

計算量は二部グラフの判定が支配項でO(N)。

CS Academy Round 51 - Tree Coloring

csacademy.com

 

ツリーと色数kが与えられる。この時、あるノードに対して、そのノードから距離1のノードと、距離2のノード両方と色が異なるように頂点を彩色したい。彩色の仕方は何通りあるか。

 

あるノードに着目する時、距離1または距離2のノードがすべて異なるということなので、そのノードの隣接ノードの集合を考える。するとその隣接ノード+今見ているノードの集合について、これらは全て距離2以下であるため、その集合の数をmと置くと彩色数は k * (k - 1) * .. * (k - m + 1) となる。ここから次の隣接ノードに移る。すると、同じように考えられるが、既にカウント済みのノードがあるため、そのカウント済みのノードをlとおくと、それらのノードの色は既にカウント済みであり、かつ全て色が異なる。したがって今見ている集合の彩色数は  (k - l) * (k - l - 1) * .. * (k - m + 1) となる。

これらをdfsで辿っていき、子ノードの彩色数の積に今見ているノードの彩色数の積、という値を返してどんどん根まで計算すると答え。O(N)。

CS Academy Round 51 - Manhattan Distances

csacademy.com

 

整数d1, d2, d3が与えられる。2次元格子点座標の3点であって、各点のマンハッタン距離がd1, d2, d3のいずれかになるような3点を構成せよ。できない場合は-1を出力せよ。

 

マンハッタン距離は距離と名付けてあるだけあって、距離公理を満たす。その為、三角不等式の成立条件が構成できる第一条件である。次に格子点座標にある場合、それらのマンハッタン距離はその三点を囲う最小の長方形の周囲の長さに等しくなる。(図を書いてみるとすぐわかる。そのため、d1+d2+d3が偶数であることも必要であり、かつ十分である。

 

そこで、単純な例として、長方形の一片が構成する3点のうちの2点でかつd1~d3の中で最大のもの(例えばd1とする)であり、その片方が原点であるようなものを考える。すると(0, 0), (0, d1) と座標が決まる。すると、残りの1点は((d2 + d3 - d1) / 2, (d2 + d1 - d3) / 2)などとなる。O(1)。

CS Academy Round 52 - Race Qualifying

csacademy.com

 

レースを行い、1~N位までの仮順位をつけた。ただし、それぞれの順位の人はa[i]回違反をしており、ペナルティを受ける。x位の人がk回違反をした場合、x+k位になる。最終順位を求めよ。

 

仮順位+ペナルティ回数でソートする。ただし、仮順位+ペナルティ回数が同じ物については、仮順位の降順ソートをする。これは例えば1位が2回ペナで3位になるのと、元の3位について、元の3位が繰り上がるからである。O(NlogN)。