DistCp ni nini katika Hadoop?
DistCp ni nini katika Hadoop?

Video: DistCp ni nini katika Hadoop?

Video: DistCp ni nini katika Hadoop?
Video: 20. Installation of Apache Hadoop 1.X (Pseudo distributed mode/Single node cluster) 2024, Novemba
Anonim

DistCp (nakala iliyosambazwa) ni zana inayotumika kwa kunakili kubwa kati ya/za ndani ya nguzo. Inatumia RamaniPunguza kutekeleza usambazaji wake, kushughulikia na kurejesha makosa, na kuripoti. Hupanua orodha ya faili na saraka kuwa ingizo kwa majukumu ya ramani, ambayo kila moja itanakili kizigeu cha faili zilizobainishwa kwenye orodha ya chanzo.

Vile vile mtu anaweza kuuliza, je, Distcp inabatilisha?

Ninapaswa pia kufafanua baadhi na kuelezea hilo distcp - futa mapenzi futa faili haijalishi ikiwa saizi inalingana au la. Hii itasasisha faili zote katika hdfs-nn2 ambazo hazilingani kwa ukubwa kutoka hdfs-nn1, na pia kufuta faili zozote za nje.

Vivyo hivyo, amri ya Hadoop FS ni nini? Mfumo wa faili ( FS ) shell inajumuisha aina mbalimbali za ganda amri ambayo inaingiliana moja kwa moja na Hadoop Mfumo wa faili uliosambazwa ( HDFS ) pamoja na mifumo mingine ya faili ambayo Hadoop inasaidia, kama vile Local FS , HFTP FS , S3 FS , na wengine.

Kwa njia hii, ninawezaje kuhamisha data kutoka kwa Hdf moja hadi Hdf nyingine?

Hadoop fs cp - Rahisi zaidi njia ya kunakili data kutoka kwa moja saraka ya chanzo kwa mwingine . Tumia hadoop fs -cp [chanzo] [lengwa]. Hadoop fs copyFromLocal - Inahitajika nakala data kutoka kwa mfumo wa faili wa ndani hadi HDFS ? Tumia hadoop fs -copyFromLocal [chanzo] [lengwa].

Ninakili vipi nguzo kutoka nguzo moja hadi nyingine?

Kunakili faili kati ya makundi . Unaweza nakala faili au saraka kati ya tofauti makundi kwa kutumia hadoop distcp amri. Lazima ujumuishe kitambulisho faili katika yako nakala omba hivyo chanzo nguzo inaweza kuthibitisha kuwa umethibitishwa kwa chanzo nguzo na walengwa nguzo.

Ilipendekeza: