Descoperiți milioane de cărți electronice, cărți audio și multe altele cu o perioadă de probă gratuită

Doar $11.99/lună după perioada de probă. Puteți anula oricând.

Căutarea, extragerea, organizarea și evaluarea informațiilor
Căutarea, extragerea, organizarea și evaluarea informațiilor
Căutarea, extragerea, organizarea și evaluarea informațiilor
Cărți electronice362 pagini7 ore

Căutarea, extragerea, organizarea și evaluarea informațiilor

Evaluare: 0 din 5 stele

()

Citiți previzualizarea

Informații despre cartea electronică

Informația, ca și concept, include o mare diversitate de sensuri în contexte diferite, de la cele zilnice până la cele tehnice. Conceptul de informație este strâns legat de noțiunile de restricție, comunicare, control, date, forme, educație, cunoaștere, înțelegere, stimul mental, model, percepție, și reprezentare. Informația este orice rețea care influențează formarea sau transformarea altor rețele. Știința informației se ocupă de analiza, colectarea, clasificarea, manipularea, stocarea, extragerea și diseminarea informației.
Căutarea informațiilor se realizează prin crearea de sisteme pentru găsirea documentelor sau a informațiilor. Colectarea informațiilor începe atunci când un utilizator introduce o interogare în sistem. Extragerea cunoașterii din informații constă în stabilirea de cunoștințe din surse structurate (baze de date relaționale, XML) și nestructurate (text, documente, imagini). Cunoașterea care rezultă și trebuie să fie într-un format care poate fi citit și interpretat de mașină și trebuie să reprezinte cunoașterea într-un mod care să faciliteze inferența. Organizarea informațiilor implică indexarea, clasificarea și reprezentarea documentelor pentru extragerea informațiilor, browsing și procese conexe, indiferent dacă sunt efectuate de oameni sau computere.
Când oamenii caută documente, informații sau cunoștințe pentru a răspunde la sau a clarifica anumite întrebări, ar trebui să li se ofere cunoștințele care corespund celor mai bune teorii și descoperiri științifice sau academice. Procesele și sistemele pentru furnizarea unor astfel de cunoștințe dezvoltate în colectarea informațiilor și organizarea cunoașterii ar trebui să ofere documente „relevante” utilizatorilor. „Relevanța” informațiilor se poate baza pe studiile utilizatorilor, pe știința cognitivă (în „ paradigma cognitivă”), pe probleme tehnologice (în „viziunea sistemelor”), sau pe filosofia științei .Relevanța este o ipoteză, al cărei răspuns se referă la conflictul dintre diferite paradigme în domeniu.

LimbăRomână
Data lansării4 apr. 2022
ISBN9786060337010
Căutarea, extragerea, organizarea și evaluarea informațiilor
Autor

Nicolae Sfetcu

Owner and manager with MultiMedia SRL and MultiMedia Publishing House. Project Coordinator for European Teleworking Development Romania (ETD) Member of Rotary Club Bucuresti Atheneum Cofounder and ex-president of the Mehedinti Branch of Romanian Association for Electronic Industry and Software Initiator, cofounder and president of Romanian Association for Telework and Teleactivities Member of Internet Society Initiator, cofounder and ex-president of Romanian Teleworking Society Cofounder and ex-president of the Mehedinti Branch of the General Association of Engineers in Romania Physicist engineer - Bachelor of Science (Physics, Major Nuclear Physics). Master of Philosophy.

Citiți mai multe din Nicolae Sfetcu

Legat de Căutarea, extragerea, organizarea și evaluarea informațiilor

Cărți electronice asociate

Afaceri pentru dvs.

Vedeți mai mult

Recenzii pentru Căutarea, extragerea, organizarea și evaluarea informațiilor

Evaluare: 0 din 5 stele
0 evaluări

0 evaluări0 recenzii

Ce părere aveți?

Apăsați pentru evaluare

Recenzia trebuie să aibă cel puțin 10 cuvinte

    Previzualizare carte

    Căutarea, extragerea, organizarea și evaluarea informațiilor - Nicolae Sfetcu

    Căutarea, extragerea, organizarea și evaluarea informațiilor

    Nicolae Sfetcu

    Publicat de MultiMedia Publishing

    © 2022 Nicolae Sfetcu

    Publicat de MultiMedia Publishing, https://www.telework.ro/ro/editura

    ISBN: 978-606-033-701-0, DOI: 10.58679/MM78324

    Surse: Secțiunile 1,2,4,5,6: Cunoaștere și Informații (2016) de Nicolae Sfetcu, ISBN 978-606-033-165-0; Big Data (2019) de Nicolae Sfetcu, ISBN 978-606-033-241-1; Wikipedia și alte surse cu traducere și adaptare Nicolae Sfetcu. Textele din aceste secțiuni sunt sub licemță CC BY-SA 3.0.

    Secțiunea 3: Hjørland, B. Information Retrieval and Knowledge Organization: A Perspective from the Philosophy of Science,  Information 2021, 12, 135. DOI: 10.3390/info12030135, sub licența CC BY 4.0. Traducere și adaptare de Nicolae Sfetcu

    DECLINARE DE RESPONSABILITATE:

    Având în vedere posibilitatea existenței erorii umane sau modificării conceptelor științifice, nici autorul, nici editorul și nicio altă parte implicată în pregătirea sau publicarea lucrării curente nu pot garanta în totalitate că toate aspectele sunt corecte, complete sau actuale, și își declină orice responsabilitate pentru orice eroare ori omisiune sau pentru rezultatele obținute din folosirea informațiilor conținute de această lucrare.

    Cu excepția cazurilor specificate în această carte, nici autorul sau editorul, nici alți autori, contribuabili sau alți reprezentanți nu vor fi răspunzători pentru daunele rezultate din sau în legătură cu utilizarea acestei cărți. Aceasta este o declinare cuprinzătoare a răspunderii care se aplică tuturor daunelor de orice fel, incluzând (fără limitare) compensatorii; daune directe, indirecte sau consecvente, inclusiv pentru terțe părți.

    Înțelegeți că această carte nu intenționează să înlocuiască consultarea cu un profesionist educațional, juridic sau financiar licențiat. Înainte de a o utiliza în orice mod, vă recomandăm să consultați un profesionist licențiat pentru a vă asigura că faceți ceea ce este mai bine pentru dvs.

    Această carte oferă conținut referitor la subiecte educaționale. Utilizarea ei implică acceptarea acestei declinări de responsabilitate.

    1. Informații

    Informația, ca și concept, include o mare diversitate de sensuri în contexte diferite, de la cele zilnice până la cele tehnice. Conceptul de informație este strâns legat de noțiunile de restricție, comunicare, control, date, forme, educație, cunoaștere, înțelegere, stimul mental, model, percepție, și reprezentare.

    Informația, într-un anumit sens, este răspunsul la o întrebare. Este, de asemenea, ceea ce rezultă din date și cunoștințe, datele reprezentând valori atribuite parametrilor, iar cunoașterea semnificând înțelegerea lucrurilor reale sau a conceptelor abstracte. Din punctul de vedere al  datelor, existența informațiilor nu este cuplată în mod necesar cu un observator (acestea există dincolo de un orizont de evenimente, de exemplu), în timp ce în cazul cunoașterii informația necesită un observator cognitiv.

    În cel mai general caz, informația este propagarea cauzei și efectului într-un sistem. Informațiile sunt transmise fie ca și conținut al unui mesaj, fie prin observare directă sau indirectă. Ceea ce este perceput poate fi interpretat ca un mesaj în sine, și, în acest sens, informația este întotdeauna transmisă ca și conținutul unui mesaj.

    Informațiile pot fi codificate în diverse forme de transmitere și interpretare (de exemplu, informația poate fi codificată într-o secvență de semne, sau transmise prin intermediul unei secvențe de semnale). Ea poate fi, de asemenea, criptată pentru stocarea în condiții de siguranță și pentru comunicare.

    Informațiile rezolvă incertitudinile. Incertitudinea unui eveniment este măsurată prin probabilitatea de apariție și este invers proporțională cu acest lucru. Cu cât este mai incert un eveniment, cu atât mai multe informații sunt necesare pentru a rezolva incertitudinea acelui eveniment. Bitul este o unitate tipică de informații, dar pot fi utilizate și alte unități, cum ar fi nat. Exemplu: informația într-o singură răsuicre echitabilă a unei monede este log2 (2/1) = 1 bit, iar în cazul răsucirii echitabile a două monede este log2 (4/1) = 2 biți.

    Abordarea teoriei informației

    Din poziția teoriei informației, informația este considerată o secvență ordonată de simboluri dintr-un alfabet, de exemplu un alfabet de intrare χ  și un alfabet de ieșire ϒ. Procesarea informațiilor constă dintr-o funcție de intrări-ieșiri care mapează orice secvență de intrare de la χ într-o secvență de ieșire de la ϒ. Maparea poate fi probabilistică sau deterministă. Aceasta poate avea sau nu memorie.

    Ca intrare senzorială

    Adesea, informațiile pot fi privite ca un tip de intrare într-un organism sau sistem. Intrările sunt de două feluri; unele intrări sunt importante în sine pentru funcționarea organismului (de exemplu, produsele alimentare) sau sistemului (energia). În cartea sa Ecologia senzorială, Dusenbery a numit aceste intrări cauzale. Alte intrări (informații) sunt importante doar pentru că acestea sunt asociate cu intrările cauzale și pot fi folosite pentru a prezice apariția unei intrări cauzale la un moment ulterior (și, probabil, un alt loc). Unele informații sunt importante din cauza asocierii cu alte informații, dar în cele din urmă trebuie să existe o conexiune la o intrare cauzală. În practică, informația este de obicei transportată de stimuli slabi, care trebuie să fie detectați de sistemele senzoriale specializate și amplificați de intrările de energie înainte ca acestea să fie funcționali pentru organism sau sistem. De exemplu, lumina este adesea o intrare cauzală pentru plante, dar furnizează informații și pentru animale. Lumina colorată reflectată de o floare este prea slabă pentru fotosinteză, dar sistemul vizual al albinelor detectează și sistemul lor nervos utilizează informațiile pentru a ghida albina la floare, unde albina își găsește de multe ori de nectar sau polen, care sunt intrări cauzale pentru ea, servind o funcție nutritivă.

    Ca reprezentare și complexitate

    Omul de știință cognitivă și în matematică aplicată Ronaldo Vigo susține că informația este un concept care implică cel puțin două entități asociate pentru a obține rezultate cantitative. Aceste entități sunt orice categorie definită dimensional de obiecte S, și oricare dintre subgrupele sale R. R, în esență, este o reprezentare a lui S, sau, cu alte cuvinte, transmite informații reprezentaționale (și, prin urmare, conceptuale) despre S. Vigo apoi definește cantitatea de informații pe care R o transmite despre S ca rata de schimbare în complexitatea lui S ori de câte ori obiectele din R sunt eliminate din S. În informațiile Vigo, modelul, invarianța, complexitatea, reprezentarea și informarea - cinci constructe fundamentale ale științei universale -  sunt unificate într-un inedit cadru matematic. Printre altele, cadrul își propune să depășească limitările informațiilor Shannon-Weaver, atunci când încearcă să caracterizeze și să măsoare informațiile subiective.

    Informația ca mesaj

    Informația este un termen cu multe sensuri în funcție de context, dar de obicei este strâns legată de concepte precum înțeles, instrucție, comunicare, reprezentare, și stimul mental. Simplist vorbind, informația este un mesaj primit și înțeles. În termeni de date, ea poate fi definită ca o colecție de fapte din care se poate extrage o concluzie. Există multe alte aspecte ale informației atâta timp cât ea este o cunoaștere obținută prin studiu sau experiență sau instrucție. Dar în primul rând informația este rezultatul procesării, manipulării și organizării datelor astfel încât se adaugă la cunoașterea persoanei care o primește.

    Informația este starea unui sistem de interes. Mesajul este informația materializată.

    Informația este o calitate a unui mesaj transmis de la un transmițător la unul sau mai mulți receptori. Informația este întotdeauna despre ceva (mărimea unui parametru, ocurența unui eveniment, valoare, etică, etc.). Văzută astfel, informația nu trebuie să fie exactă; ea poate fi un adevăr sau o minciună, sau doar sunetul unui copac care se prăbușește. Chiar și bruiajul care împiedică o comunicare și creează astfel false înțelesuri este, din acest punct de vedere, o informație. Oricum, în general vorbind, dacă cantitatea de informație din mesajul primit crește, mesajul devine mai exact.

    Acest model presupune că este definit un transmițător și cel puțin un receptor. Multe aprofundări ale modelului presupun existența unui limbaj comun de înțelegere între transmițător și cel puțin unul dintre receptori. O importantă variație identifică informația ca cea care ar fi comunicată de către un mesaj dacă ar fi transmisă de către un transmițător către un receptor capabil să înțeleagă mesajul. Într-o altă variație, nu este necesar ca transmițătorul să fie capabil să înțeleagă mesajul, nici măcar să își dea seama că acesta este un mesaj, făcând informația drept ceva care poate fi extrasă dintr-un mediu, de ex. prin observare, citire sau măsurare.

    Teoria comunicației oferă o măsură numerică a incertitudinii unui eveniment. de exemplu, putem spune că semnalul conținea mii de biți de informație. Teoria comunicației tinde să folosească acest concept de entropia informației, atribuit de obicei lui Claude Shannon.

    O altă formă a informației este informația Fisher, un concept al lui R.A. Fisher. Acesta este folosit în aplicarea statisticii la teoria estimării și în știință în general. Informația Fisher este gândită ca fiind cantitatea de informație pe care o transportă un mesaj despre un parametru neobservabil. Ea poate fi determinată din cunoașterea funcției de verosimilitate definită de sistem. De exemplu, cu o funcție de verosimilitate normală, informația Fisher este reciproca varianței legii. În absența cunoașterii legii verosimilității, informația Fisher poate fi calculată din datele de marcare normal distribuite ca reciproca celui de al doilea moment.

    Chiar dacă informația și datele sunt adesea folosite ca un sistem interschimbabil, ele sunt foarte diferite. Datele sunt un set de informații fără legătură, și deci nu pot fi folosite dacă nu sunt evaluate corect. După evaluare, când apar legături semnificative între date și acestea devin relevante pentru ceva anume, acestea sunt convertite în informație. Acum aceleași date pot fi folosite în diferite scopuri. Astfel, atâta timp cât datele nu transportă o anumită informație, ele nu sunt utile și deci nu pot fi considerate drept informație.

    Informația ca determinant al transformărilor

    Informația este orice rețea care influențează formarea sau transformarea altor rețele. În acest sens, nu este nevoie de conștientizarea, cu atât mai puțin de aprecierea rețelei. Să considerăm de exemplu DNA. Secvența nucleotizilor este o rețea care influențează formarea și dezvoltarea unui organism fără a fi nevoie de conștientizare. Teoria sistemelor se referă uneori la informație în acest sens, presupunând că informația nu implică în mod necesar conștientizarea, și că mișcarea rețelelor (datorită reacției) în sistem poate fi considerată informație. Cu alte cuvinte, se poate spune că informația în acest sens este ceva potențial văzut ca reprezentare, deși necreat sau prezentat în acest scop.

    Dacă premisa influenței implică faptul că informația a fost conștientizată și interpretată, contextul specific asociat cu interpretarea poate cauza transformarea informației în cunoaștere. Definițiile complexe atât pentru informație cât și pentru cunoaștere fac o astfel de analiză semantică și logică dificilă, dar condiția transformării este un punct important în studiul informației în contextul legăturilor cu cunoașterea, în special în managementul cunoașterii din afaceri. Aici, instrumentele și procesele sunt folosite pentru a ajuta specialistul în cunoaștere în cercetare și decizie, incluzând trepte precum:

    revederea informației pentru valorificare și înțelegere

    evidențierea metadatelor dacă sunt disponibile

    stabilirea unui context relevant, adesea selectând din mai multe contexte posibile

    extragerea de noi cunoașteri din informație

    luarea de decizii sau recomandări rezultate din cunoaștere.

    Stewart (2001) consideră că transformarea informației în cunoaștere este una critică, aspect ce stă la baza creării valorii și avantajului competitiv pentru intreprinderile moderne.

    Marshall McLuhan vorbește de media și efectele sale asupra culturii umane făcând referire la structura artefactelor care la rândul lor ne formează comportamentele și mentalitățile. De asemenea, fenomenele sunt numite adesea informație în acest sens.

    Utilizarea studiului informațiilor

    Ciclul de informații (abordat în ansamblul său sau în componentele sale distincte) este o preocupare majoră pentru tehnologia informației, sisteme de informații, și știința informației. Aceste domenii se ocupă de aceste procedee și tehnici referitoare la captarea de informații (prin intermediul senzorilor) și generarea (prin calcul, formulare sau compoziție), prelucrarea (inclusiv codificare, criptare, compresie, ambalare), transmisia (incluzând toate metodele de telecomunicații), prezentarea (inclusiv metode de vizualizare/afișare), stocarea (de ex. magnetic sau optic, care includ metode holografice), etc. Informațiile nu încetează să mai existe, ele doar pot trece dincolo de orice posibilitate de a le recupera (în teoria informației, a se vedea de compresie cu pierderi, în fizică, paradoxul informații din găurile negre se rezolvă cu ajutorul principiului holografic).

    Vizualizarea informațiilor (prescurtat, InfoVis), depinde de modul de calcul și de reprezentarea digitală a datelor, și ajută utilizatorii în recunoașterea formelor și detectarea anomaliilor.

    Securitatea informațiilor (prescurtat, InfoSec) reprezintă procesul continuu de efectuare a procesului de verificare pentru a proteja informațiile, și sistemele informatice, împotriva accesului, utilizării, dezvăluirii, distrugerii, modificării, defectării sau distribuției neautorizate, cu ajutorul unor algoritmi și proceduri concentrați pe monitorizare și detectare, și pe reacția la incidente și reparații.

    Analiza informațiilor este procesul de inspecție, transformare, și modelare a informațiilor, prin transformarea datelor brute în cunoștințe acționabile, în sprijinul procesului de luare a deciziilor.

    Calitatea informațiilor (InfoQ) reprezintă potențialul unui set de date pentru a atinge un anumit obiectiv (științific sau practic), folosind o anumită metodă de analiză empirică.

    Comunicarea informațiilor reprezintă convergența în domeniul informaticii, telecomunicațiilor și media audiovizuală, și conținut.

    Informații mediate tehnologic

    Se estimează că capacitatea tehnologică din lume pentru a stoca informații a crescut de la 2,6 exabiți (comprimat în mod optim), în 1986 - ceea ce este echivalentul informațional a mai puțin de un CD-ROM de 730-MB pentru fiecare persoană (539 MO pentru fiecare persoană) - până la 295 exabiți în 2007 (comprimat în mod optim). Acesta este echivalentul informațional a aproape 61 de CD-ROM-uri pentru fiecare persoană, în anul 2007.

    Capacitate tehnologică combinată la nivel mondial pentru a primi informații prin intermediul rețelelor de emisie unidirecționale a fost echivalentul informațional a 174 de ziare per persoană pe zi, în 2007.

    Capacitatea efectivă combinată la nivel mondial pentru a face schimb de informații prin intermediul rețelelor de telecomunicații bidirecționale a fost echivalentul informațional al 6 ziare per persoană pe zi, în 2007.

    Informații sub forma unor fișiere

    Înregistrările sunt forme specializate de informare. În esență, înregistrările sunt o informație prezentată în mod conștient sau ca produse secundare ale activităților comerciale sau tranzacțiilor și păstrate din cauza valorii lor. În primul rând, valoarea lor este de dovadă a activității organizației, dar ele pot fi, de asemenea, păstrate pentru valoarea lor informațională. Managementul înregistrărilor de sunet asigură faptul că integritatea înregistrării să fie păstrată atât timp cât acestea sunt necesare.

    Standardul internațional privind gestionarea înregistrărilor, ISO 15489, definește înregistrările ca fiind informații create, primite și menținute ca probe și informații de către o organizație sau o persoană, în conformitate cu obligațiile legale sau în tranzacția de afaceri. Comisia Comitetului Internațional al Arhivelor (ICA) pentru înregistrările electronice a definit o înregistrare ca o piesă specifică de informații înregistrată generată, colectată sau primită în inițierea, derularea sau finalizarea unei activități și care cuprinde un conținut suficient, contextul și structura pentru a oferi dovada sau dovezi ale acestei activități .

    Înregistrările pot fi menținute pentru a păstra memoria corporativă a organizației sau pentru a îndeplini cerințele legale, fiscale sau responsabilitățile impuse organizației. Willis (2005) și-a exprimat opinia că pentru o bună gestionare a înregistrărilor de afaceri și a informațiilor livrate sunt necesare ... șase cerințe esențiale pentru o bună guvernanță corporativă ... transparență, responsabilitate; un proces echitabil; conformare, care îndeplinesc cerințele legale în materie și comune de drept, și securitatea personală și informații corporative.

    Semiotica

    Beynon-Davies explică conceptul multi-fațetă al informațiilor în termeni de semne și sisteme de semnal de conectare. Semnele în sine pot fi considerate în termenii a patru niveluri inter-dependente, straturi sau ramuri ale semioticii: pragmatica, semantica, sintaxa și empiricismul. Aceste patru straturi servesc la a conecta lumea socială, pe de o parte, cu lumea fizică sau tehnică pe de altă parte.

    Pragmatica este preocupată de scopul comunicării. Pragmatica leagă problema semnelor cu contextul în care sunt utilizate semnele. Accentul pragmaticii este pe intențiile agenților în acțiune care stau la baza comportamentului comunicativ. Cu alte cuvinte, pragmatica leagă limbajul de acțiune.

    Semantica este preocupată de semnificația unui mesaj transmis într-un act de comunicare. Semantica consideră conținutul comunicării. Semantica este studiul sensului semnelor - asocierea dintre semne și comportament. Semantica poate fi considerată ca studiul legăturii dintre simboluri și referenții sau conceptele lor - în special modul în care semnele se referă la comportamentul uman.

    Sintaxa este preocupată de formalismul utilizat pentru a reprezenta un mesaj. Sintaxa ca domeniu studiază forma de comunicare în ceea ce privește logica și gramatica sistemelor de semne. Sintaxa este dedicată studiului formei, mai degrabă decât conținutul semnelor și sistemele de semne.

    Empirismul este studiul semnalelor folosite pentru a transporta un mesaj; caracteristicile fizice ale mediului de comunicare. Empirismul este dedicat studiului canalelor de comunicare și a caracteristicilor acestora, de exemplu, sunet, lumină, transmisie electronică, etc.

    Nielsen (2008) discută despre relația dintre semiotică și informații în contextul dicționarelor. Conceptul de costuri de informare lexicografice se introduce și se referă la eforturile pe care trebuie să le facă utilizatorii de dicționare pentru, în primul rând, a găsi datele căutate și, pe de altă parte, să înțeleagă datele, astfel încât acestea să poată genera informații.

    Comunicarea există în mod normal în contextul unor situații sociale. Situația socială stabilește contextul intențiilor transmise (pragmatica) și forma în care are loc comunicarea. Într-o situație de comunicare intențiile sunt exprimate prin mesaje care cuprind colecții de semne legate între ele luate dintr-o limbă care se înțelege reciproc de către agenții implicați în comunicare. Înțelegerea mutuală implică faptul că agenții implicați să înțeleagă limba aleasă, în ceea ce privește sintaxa convenită (sintactica) și semantica. Expeditorul codează mesajului în limbă și transmite mesajul ca semnale de-a lungul unor canale de comunicare (empirism). Canalul de comunicare ales va avea proprietăți inerente care determină rezultate, cum ar fi viteza cu care comunicarea poate avea loc și distanța.

    1.1. Filosofia informației

    Filosofia informației este

    Îți este utilă previzualizarea?
    Pagina 1 din 1