Amazon Glacier – Mimořádně levné zálohování dat

Na konci srpna Amazon představil novou službu Glacier (česky Ledovec) určenou pro zálohování, samotné skladování dat je mimořádně levné, řádově haléře za gigabajty dat měsíčně.

Glacier je tak ideální cloudové úložiště pro zálohování velkých objemů dat, která právě teď nepotřebujeme, ale rádi bychom si je uchovali pro strýčka Příhodu. Kromě zmíněné cenové politiky má i další příznivé vlastnosti:

  • je bezpečný – vaše data jsou šifrována a nedostanou se tak do nepovolaných rukou,
  • je stabilní – předpokládá se spolehlivost 99,999999999%, což je mnohonásobně více, než kterékoliv vaše záložní disky,
  • je flexibilní – nejsou stanovena žádná minima ani maxima, nahrávejte kolik chcete kdykoliv potřebujete,
  • a umožňuje automatické zpracování – nemusíte data do Glacieru nahrávat ručně, vše lze snadno automatizovat.
Amazon Glacier – All Rights Reserved © 2012Tnooz

Pro koho je Amazon Glacier určen

Nyní nejspíš jen pro firmy, programátory a technické nadšence. Služba vyšla na světlo před několika dny, vhodné nástroje na její použití teprve vznikají. Postupem času bude zálohování do Glacieru možné jedním kliknutím v mnoha aplikacích (např. správce fotek, hudby, z telefonů, záloha webů v hostingu atd.).

Cena podrobně

Všechny ceny uvádím přepočtené na koruny podle aktuálního kurzu 20 Kč/1 USD a vycházím z cen stanovených pro datacentrum v Irsku (viz dále).

Skladování dat – 0,22 Kč za GB / měsíc
Pro lepší představu:

1 CD 0,15 Kč / měsíc
1 DVD 1,03 Kč / měsíc
100 GB 22,00 Kč / měsíc

 

Upload dat – zdarma
Tedy téměř zdarma. Neplatí se totiž za přenesená data, ale za jednotlivé požadavky. Zjednodušeně: 1 soubor = 1 požadavek (request) při ceně 1,10 Kč za 1000 požadavků.

Download dat – zdarma do 1 GB
Každý měsíc můžete bezplatně stáhnout zálohy až do velikosti 1 GB, případně pokud máte uloženo hodně dat, lze bezplatně stahovat až do 5 % celkové velikosti uložených dat.
Nad rámec je cena dále stanovena na 2,40 Kč za GB stažených dat. Více informací.
I zde však navíc účtována cena 1,10 Kč za 1000 požadavků.

Smazání dat – zdarma
Pokud byl soubor uložen alespoň 90 dní, je smazání zdarma. V opačném případě je účtován poplatek 0,66 Kč za GB smazaných dat. Více informací.

Úplný ceník služeb (přepněte si na Region EU)


WTF?!

Tak drahé stahování? A platit za smazání? Co je to za nesmysl?!

Svojí cenovou politikou se Amazon snaží službu nastavit pro určité způsoby použití. Nízká cena úložiště je lákavá a našli by se koumáci, kteří by službu mohli zneužívat například pro přenos souborů a podobně. Pokud budete Glacier využívat pro archivaci záloh, nebude se vás některé položky v ceníku týkat.

Pokud hledáte úložiště pro data, ke kterým potřebujete přistupovat často a rychle, zkuste například úložiště Amazon S3, Dropbox, Google Drive, nebo Skydrive, některé navíc mohou být v základu zdarma.

Použití Glacieru

Amazon Glacier je součástí produktu nazvaného Amazon web services, zkráceně AWS.

Pokud zde ještě žádný účet nemáte, připravte se na to, že při registraci musíte Amazonu předat číslo vaší platební karty. Tím Amazon získá přístup k vašemu bankovnímu účtu a sám si bude na konci měsíce strhávat částky za využité služby. V Čechách není tento způsob placení rozšířený a vzbuzuje tak přirozenou nedůvěru až strach. Je to ale jeden z nejefektivnějších a nejlevnějších způsobů placení účtů v zahraničí a i přes určitá rizika.

Služby Amazonu využívám delší dobu, vyúčtování jsou velmi podrobná, přesně vím, kolik a za co platím. Stejně podrobný je i aktuální stav využití služeb, na konci měsíce vás proto nepřekvapí vysoký účet. Moje měsíční vyúčtování se zatím pohybovalo kolem 10Kč / měsíčně i přesto, že mi na něm z části provozuji jeden velký e-shop a tento blog. Pokud máte k placení kartou dotazy, obraťte se na svého bankéře, nebo mi napište dotaz do komentářů.

Vyúčtování služeb AWS za srpen 2012

Pro samotné nahrávání dat do cloudu Amazon neposkytuje žádný nástroj. Dostupné je pouze API, tedy programovatelné rozhraní a můžeme proto očekávat, že brzy k tomu budou dostupné nové nástroje. V tuto chvíli je pro Windows dostupný například FastGlacier, který je v základní verzi zdarma. Je samozřejmě stále ve vývoji, nové funkce v něm přibývají každým dnem a budu mu věnovat druhý díl článku.

Vraťme se ale zpět, zatím jen teoreticky.
Úložiště Glacier se dělí na trezory a ty pak na jednotlivé archivy.

Schéma Amazon Glacier · © 2012 Amazon Web Services LLC

Trezory (vaults) – umožňují rozdělit úložiště na menší celky podobně jako složky v počítači. A dále v nastavení zabezpečení můžete různým aplikacím přidělovat přístupy k jednotlivým trezorům a tím zvýšit kvalitu zabezpečení vašich dat. Můžete mít až 1000 trezorů.

Archivy (archives) – archiv je pouze jiný název pro soubor. Můžete nahrávat jakékoliv soubory, nemusí to být ZIP nebo TAR archívy. Ovšem v praxi má smysl jednotlivé soubory zabalit do jednoho vetšího archivu, usnadníte si tím práci se zálohami a především ušetříte za přenos jednotlivých souborů (viz ceník). Počet a množství archivů není omezeno, velikost jednoho archivu je omezena na 4 TB.

Upload archivů je rychlý, pravděpodobně budete omezeni pouze rychlostí vašeho připojení. Velké soubory se nahrávají po částech, aby v případě výpadků docházelo jen k minimálnímu opakování. Je nutné upozornit, že každá část představuje vlastní požadavek na server, což se může projevit ve vyúčtování; velikost dílčích částí není stanovena a můžete ji zvolit dle vlastního uvážení.

Vnitřní procesy úložiště jsou nezvykle pomalé, po uploadu se archivy jakoby ztratí a nejsou přibližně 24 hodin vidět v žádném výpisu. To je normální. Ihned po nahrání souborů provede server kontrolu integrity a potvrdí jejich úspěšné přijetí – na tuto informaci se můžete spolehnout. Je  to stejné jako posílání peněz mezi bankami – v jednom účtu peníze zmizí a ve druhé ještě nejsou a chvíli visí kdesi ve vzduchoprázdnu.

Získávání dat z úložiště je také pomalé a probíhá ve dvou krocích:

  1. Vytvoření úlohy (job) – data nejsou dostupná hned, nejdříve zašlete požadavek a systém je asi do 4 hodin připraví ke stažení.
  2. Stažení dat (download) – jakmile je úloha dokončena, můžete si data stáhnout.

Samozřejmě je možné požádat o více archivů současně a během 4 hodin tak máte všechna data k dispozici. Samotné stažení je pak rychlé.

Nicméně i seznam uložených archivů nelze získat ihned a vztahuje se na něj dvou-krokové získání. Předpokládá se, že tyto seznamy si budou aplikace efektivně cachovat.

Technické pozadí

Jak Amazon dokázal minimalizovat náklady za uložení dat při zachování vysoké spolehlivosti? Na webu Amazonu není o použité technologii žádná zmínka, což vedlo k domněnkám, že se takto Amazon snaží zužitkovat staré dosluhující železo, popřípadě nějak využívá alternativní metody uchování dat, např. na páskách s automatizovaným přístupem.

Velkou stopu položil bývalý zaměstnanec Amazonu, který se v diskuzi lehce rozpovídal a naznačil, že si Amazon nechal vyrobit vlastní hard-disky speciálně upravené na nízké otáčky s možností dalšího snížení otáček podle potřeby a upravené jsou i desky strojů na nízký příkon. Tím se dosahuje úspory energie, vyšší životnosti disků – ovšem za cenu velké přístupové doby k datům a malé rychlosti čtení/zápisu. Specifické jsou i racky, jejich napájení je údajně omezeno natolik, že dokáže roztočit disky na plnou rychlost jen na daném stojanu.

Doufám, že jsem to přečetl správně.

Závěrem

Amazon Glacier představuje slušný killer pro mnohé produkty a svojí otevřeností se přímo nabízí k využití místo drahých úložišť, ve kterých firmy často skladují své archivy.

Jednoduché API umožní vývoj nových zajímavých způsobů zálohování i pro domácí stanice, můžeme se těšit spolupráci s jinými službami třetích stran (například webové hostingy) a také některými aplikacemi v PC (střihací pulty, grafické programy, projektové  a informační systémy).

Je to totiž poprvé, co je cena za roční provoz služby srovnatelná s investicí do pevného disku.