Kas ir Wayback Machine un kāpēc tā ir noderīga?
Internets Tīmekļa Vietnes Varonis / / April 22, 2021
Pēdējoreiz atjaunināts
Wayback Machine ir vispopulārākā Interneta arhīva vietne. Pirmo reizi ieviestais 2001. gadā, bezmaksas tiešsaistes rīks ļauj jums atgriezties "atpakaļ laikā", lai redzētu, kādas vietnes visā pasaulē izskatījās noteiktā laikā. Wayback Machine piedāvā 562 miljards rakstīšanas laikā, ar katru gadu pievienojot vēl daudz citu.
Piedāvājam ieskatu Wayback Machine un ar ko tas ir īpašs.
Interneta arhīva ievads
Brewster Kahle un Bruce Gilliat izveidotie interneta arhīvi ir bezpeļņas organizācija, kurai ir noteikta misija “universāla piekļuve visām zināšanām”. No sākuma, organizācija ir nodrošinājusi bezmaksas publisku piekļuvi digitalizētiem materiāliem, piemēram, tīmekļa lapām, grāmatām, audio ierakstiem, tostarp koncertiem, video, attēliem un programmatūrai programmas.
Līdz šim viss, ko apkopojis interneta arhīvs, aizņem vairāk nekā 70 Petabaiti servera vietas, ieskaitot divas visa kopijas. Organizāciju finansē no ziedojumiem, dotācijām un honorāriem no grāmatu digitalizācijas pakalpojumiem. Privātuma labad interneta arhīvs neuzskaita lasītāju IP adreses un visā tā laikā izmanto HTTPS (drošo) protokolu.
Wayback Machine
Tikai viena interneta arhīva daļa, Wayback Machine, bija paredzēta, lai tvertu mainītu vai noņemtu vietnes saturu. Kopš palaišanas tā ir kļuvusi par vienu no populārākajām un atzītākajām vietām tīmeklī. Kahle un Gilliat šo vietni nosauca pēc izdomātas ierīces, kas ceļoja laikā 1960. gadu animācijas sērijās The Rocky and Bullwinkle Show.
Lai gan interneta arhīvs šo vietni publiski neizlaida tikai 2001. gada oktobrī, Wayback Machine kešatmiņā saglabāto tīmekļa lapu arhivēšanu sāka 1996. gada maijā. Līdz 2001. gadam digitālās lentes glabāja informāciju, kas bija pieejama tikai atsevišķiem zinātniekiem un pētniekiem. Kad pēc pieciem gadiem viss nonāca publiski pieejams (kā jau sen bija plānots), tajā jau bija vairāk nekā 10 miljardi arhivētu lapu.
Uzglabāšana un kolekcijas
Mūsdienās vietne glabā vēsturiskos tīmekļa datus Linux mezglu kopā. Wayback Machine, izmantojot savu pārmeklēšanas mehānismu, lejupielādē visu publiski pieejamo informāciju un datu failus tīmekļa lapās. Tomēr šeit nav iekļauts viss vietnē ievietotais, jo daļa satura ir ierobežota vai glabāta datu bāzēs, kas nav pieejamas. Tāpēc dažas vietnes ir labāk pārmeklētas nekā citas, atkarībā no tā, kā izstrādātāji vienlaikus izveidoja vietni.
Jūs pamanīsit arī jaunāku arhīvu, jo vairāk satura ir pieejams jebkurai vietnei. Jauns rīks, kuru 2005. gadā ieviesa interneta arhīvs, ir viens no iemesliem, kāpēc jaunāki dati ir pilnīgāki. Archive-It.org palīdz pārvarēt daļēji kešatmiņā saglabāto vietņu neatbilstības, ļaujot iestādēm un satura veidotājiem iegūt un saglabāt digitālā satura kolekcijas.
Par rāpošanu
Tīmekļa rāpuļprogrammas, kuras dažreiz sauc par zirnekļiem vai zirnekļbotēm, ir tikpat vecas kā pats internets. Šie rāpuļprogrammas ir interneta roboti, kas nepārtraukti pārlūko tīmekli indeksēšanas nolūkos, padarot tos par svarīgu jebkuras mūsdienu meklētājprogrammas sastāvdaļu. Rāpuļprogrammas, ko izmanto Wayback Machine, lai izveidotu vietņu digitālos momentuzņēmumus, nāk no dažādiem avotiem, kas laika gaitā ir mainījušies.
Kā jūs ātri pamanīsit, momentuzņēmumu uzņemšanas biežums dažādās vietnēs ir ļoti atšķirīgs. Parasti, jo lielāka (un varbūt populārāka) vietne, jo vairāk notiek rāpošana. Turklāt daudz kas ir atkarīgs no tā, cik bieži vietnē tiek veiktas lapu izmaiņas. Pat mazākās vietnes galu galā tiek pārmeklētas, ja vien nav iemesla, kāpēc tās nav. Piemēram, netiek pārmeklētas ar paroli aizsargātas vietnes, kā arī vietnes, kuru vietņu īpašnieki ir pieprasījuši, lai tās netiktu iekļautas.
Wayback Machine izmantošana
Wayback Machine vietni ir viegli izmantot ikvienam. Lai atrastu vietnes vēsturiskos momentuzņēmumus, vietnes meklētājprogrammā ierakstiet tās nosaukumu. Meklēšanas rezultātu lapā hipersaites apzīmē vietnes arhivēšanas datumus un laikus. Noklikšķiniet uz saites, lai redzētu vietni “atpakaļ laikā”.
Turpmākajos piemēros varat redzēt Apple vietnes sākumlapu, kas ierakstīta 2005. gada februārī un 2014. gada novembrī, un CNN mājas lapu no datuma 2004. gada martā un 2010. gada septembrī.
Piezīme. Šie pārmeklējumi ietver arī saites uz citām lapām, kas ierakstītas norādītajos datumos, ne tikai uz sākumlapām.
Papildu rīki
Wayback Machine ir izveidots gan pētniekiem, gan sabiedrībai, un tajā ir daži iebūvēti rīki, kurus ikdienas lietotāji varētu palaist garām. Piemēram, pēc noformējuma meklēšanas rezultātu lapās ir viegli atsaukties. Kā paskaidrots: “Ja savā tīmekļa lapā vai rakstā atrodat arhivētu lapu, uz kuru vēlaties atsaukties, varat kopēt URL. Jūs pat varat izmantot neskaidru URL atbilstību un datuma specifikāciju... bet tas ir mazliet vairāk. ”
Wayback Machine arī ļauj vietņu īpašniekiem izmantot funkciju “Saglabāt lapu tūlīt”, lai saglabātu konkrētu lapu. Un tomēr tas nav ideāls. Pašlaik šī funkcija nepievieno vietnes URL citiem rāpuļprogrammām. Turklāt pieprasījums nesaglabā vairāk nekā vienu lapu. Tomēr tas ir labs pirmais solis, lai arhivētu savas vietnes sākumlapu vēsturiskajam ierakstam.
Lai veiktu jaunu meklēšanu, jums nav katru reizi jāapmeklē Wayback Machine. Tā vietā jūs varat atrast saturu, ierakstot adresi tīmekļa pārlūkprogrammas rīkjoslā. Izmantojiet šo formātu visiem meklēšanas vaicājumiem: http://web.archive.org/*/www.yoursite.com/*. Piemēram, izmantojiet http://web.archive.org/*/www.groovypost.com/* atrast arhivētās lapas GroovyPost!
Mobilie un izstrādātāju rīki
Visbeidzot, Wayback Machine atrodas ne tikai tīmeklī. Jūs varat atrast lietotni Wayback Machine iOS un Android. Ir arī paplašinājumi pārlūkiem Chrome, Safari un Firefox. Izstrādātāji arī vēlēsies pārbaudīt interneta arhīva Wayback Machine API. Tādējādi izstrādātājiem ir vieglāk iegūt informāciju par Wayback uztveršanas datiem.
Interneta arhīva Wayback Machine atbalsta vairākas dažādas API. To darot, izstrādātājiem ir vieglāk iegūt informāciju par Wayback uztveršanas datiem.
Atgriešanās savās iecienītākajās vietnēs ir iemesls, kāpēc apmeklēt Wayback Machine. Tas ir arī lielisks rīks ikvienam, kurš pēta vietnes vēsturi skolas projektiem vai uzņēmējdarbībai. Lai ko jūs darītu, apmeklējiet Wayback Machine un uzziniet, ko varat atklāt, veicot dažas vienkāršas darbības.
Lai iegūtu papildinformāciju par interneta arhīva abonēšanas pakalpojumu Archive-It, apmeklējiet vietni oficiālā mājas lapa un sāc dot savu ieguldījumu jau šodien!