Ni injini gani ya usindikaji wa data nyuma ya Amazon Elastic MapReduce?
Ni injini gani ya usindikaji wa data nyuma ya Amazon Elastic MapReduce?

Video: Ni injini gani ya usindikaji wa data nyuma ya Amazon Elastic MapReduce?

Video: Ni injini gani ya usindikaji wa data nyuma ya Amazon Elastic MapReduce?
Video: Создание приложений для мобильных устройств, игр, Интернета вещей и многого другого с помощью AWS DynamoDB, автор Рик Хулихан. 2024, Mei
Anonim

Amazon EMR hutumia Apache Hadoop kama inavyosambazwa injini ya usindikaji wa data . Hadoop ni chanzo wazi, mfumo wa programu ya Java ambayo inasaidia data -matumizi makubwa yaliyosambazwa yanayoendeshwa kwenye makundi makubwa ya vifaa vya bidhaa.

Aidha, Amazon Elastic MapReduce ni nini?

Amazon Elastic MapPunguza ( EMR ) ni Huduma za Wavuti za Amazon ( AWS ) chombo cha usindikaji na uchambuzi mkubwa wa data. Amazon EMR huchakata data kubwa kwenye nguzo ya Hadoop ya seva pepe Amazon Elastic Kuhesabu Wingu ( EC2 ) na Amazon Huduma Rahisi ya Uhifadhi ( S3 ).

Zaidi ya hayo, je, Amazon EMR inasimamiwa kikamilifu? Ni kusimamiwa kikamilifu huduma ya ziwa ya data inayoweza kutenganisha hifadhi ya data kutoka kwa rasilimali za kukokotoa na badala yake kufanya makundi ya hesabu kuwa makubwa, yanayopatikana ili kutumika yanapohitajika, na inajumuisha uwezo wa makundi mengi kufikia seti sawa za data mara moja.

Mtu anaweza pia kuuliza, AWS EMR inafanyaje kazi?

Kwa ujumla, unapochakata data ndani Amazon EMR , ingizo ni data iliyohifadhiwa kama faili katika mfumo uliouchagua wa faili, kama vile Amazon S3 au HDFS. Data hii hupita kutoka hatua moja hadi nyingine katika mlolongo wa uchakataji. Hatua ya mwisho huandika data ya pato kwa eneo maalum, kama vile Amazon Ndoo ya S3.

Kuna tofauti gani kati ya ec2 na EMR?

Tofauti EMR , EC2 haiainishi nodi za watumwa kuwa msingi na nodi za kazi. Hii huongeza hatari ya kupoteza data ya HDFS iwapo nodi itaondolewa/kupotea. EC2 hutumia maktaba za Apache (s3a) kupata data kwenye s3. Kwa upande mwingine, EMR hutumia msimbo wa umiliki wa AWS kupata ufikiaji wa haraka wa s3.

Ilipendekeza: