2008年4月18日金曜日

今回のリンデン、データーサーバーメンテナンスについて

私のブログでも書いていますが、こちらでもアナウンスします。

昨日は本来1.21用サーバーの更新作業がリンデンのメンテスケジュールに組み込まれていましたが、問題があったので、急きょ1.20のサーバーのセキュリティー強化の方向に変更したそうですが、

では肝心の1.21サーバーは何時取りかかってくれるのか?といったことで、詳しいアナウンスがありましたので報告します。

昨日結局、1.21用サーバーを配備しようとして、問題が見つかり元に戻したと、ここでも書きましたが、その後その作業はどうなるのかといった事がアナウンスされました。

結局の所、どうしても1.20のままでは、データー・ベースに過剰に負荷がかかるのは避けられず、少なくともそのピークに達する前に再起動して、その状況 を避けるしか方法がなかったわけですが、しかしいきなりすべてのサーバーを同時に再起動するのは、非常に危険と判断したようです。

非常に負荷のかかった状態で、メンテを行い再起動しても接続と同時に高い負荷がかかってしまい、そのあとの問題が発生した場合、対処が余計難しくなるのがその理由のようです。

そこで、地域別に2つに1.20の更新を行う事にしたそうで。
それぞれ始めにセキュリティとパフォーマンスの問題に取りかかり、なるだけ使用できるメモリー領域を広げる処置に取りかかると。

スケジュールなんですが、

木曜日04/17に100の地域に対しセキュリティーパッチを適用。
理想としては1.20は、1500の地域に適用すするのが望ましい感じらしいです。

金曜日の朝04/18 、5-9AM残り半分の1.20の地域に適用。

土曜日の朝04/18 、5-9AM更に残った地域に適用。

結局いろんな制約が絡むため、作業を2つに分割するしかないようで、もし再起動が朝になってしまった場合、データーベースの負荷がピークに達する前に停止 する必要が出て来るそうです。つまり、少なくとも金曜日の朝に再起動する場合、約半分のグリットをカバーした方がサーバーの負荷がピークに達する場合の安 全だということらしい。まあ週末は避けたいんですよということでしょう。

結局1.21に着手するのは来週。こうすることがメインサーバーの負荷を軽減できる策だということのようです。

で、もうお気づきの方も多いと思いますが、こんなことを私も経験しました。

例えば階段の途中や丘の上で立ち止まると、膝が奇妙な曲がり方をしてたり(曲げすぎているというか、とにかく不自然。歩き出すと治るが、影響が少し残される)とか、

別にSIMの境界でもないのに、歩いていたらいきなり床(地面)が抜けて、落っこちるのはいいが、プリムは透過性にしてあるわけではないので地上に出られない。

カメラコントロールで、正反対の方を表示しようとすると、完全にプリムが消滅する(一瞬または数秒間)などの不具合、そしてやたらチラつくとか。

SIMによってはクラッシュする問題。アバターが座るとなぜかイスが消滅しているとか・・。(なんか一瞬アレ?とか思うけどすぐ治る)

あとはとにかく地域の包括的なパフォーマンスの向上など。サーバー側の既知の問題修正なので、今回のビュワー更新はありません。最近重いわ~って感じてましたもんね。結局稼働しながらの修正作業なのでトラフィックでどうしても障害はでるは、再起動しなくてはならないわで、常に負荷がかかった状態で住人のアクセスがデータベースに集中するんですから、当然といえば当然。

まあ結果として2週間、サーバーメンテナンスに費やすことになりそうです。

0 件のコメント: