Big Data ақпарат тасқынындағы замануи тенденциялардың бірі. Бұл туралы 7kun.kz толығырақ түсіндіреді.
Big Data дегеніміз не?
Big Data термині тура мағынасында "үлкен ақпарат" деген ұғымды білдіреді. Бірақ оның қаншалықты үлкен ақпарат екендігін анықтайтын нақты өлшем жоқ. Атауының өзі субьективті. Дегенмен, Big Data тек мәліметтер көлемін ғана білдірмейді. Оны ауқымды ақпараттармен жұмыс істеу тәсілдері деп түсінуі қажет. Big Data негізгі мына операцияларды орындауы тиіс:- Volume:"стандартты" құжаттармен салыстырғанда өте үлкен көлемдегі мәліметтерді өңдей білу.
- Variety:Үлкен көлемде түсетін және үнемі келіп отыратын жылдам ақпарат тасқынымен жұмыс істей білу. Яғни мәліметтер белгілі бір деңгейде қалып қоймайды, үсті-үстіне көбейіп отырады.
- Velocity: Құрылымды және нашар құрылған мәліметтермен жұмыс істей білу қажет.
Қалай қолданады?
Bid Data ұғымы бірнеше жылдан астам қолданылып келеді. Бірақ терминнің өзі әдетте ІТ сферасындағы мамандар үшін ғана түсінікті екендігі рас. Big Data-ның пайдалануын тереңірек түсіну үшін бірнеше мысалдар ұсынамыз. 2 жыл бұрын Target дүкендер желісі сатып алушылармен жұмыс істеу кезінде автоматты таңдау жүйесін пайдалана бастады. Бірнеше жыл бойы компанияда жинақталған мәліметтер белгілі бір жүйе бойынша сұрыпталып отырды. Ол ақпараттардың барлығы банк және жеңілдік карталар арқылы алынды. Машиналық есептеуіш сатып аушылардың талғамы қалай өзгеріп отырғандығын сараптап, болжам жасап отырды. Осы болжамдар негізінде тұтынушыға арнайы ұсыныстар жіберілетін еді. 2012 жылдың көктемінде 12 жасар мектеп оқушысының әкесі қызына жүкті болғандарға арналған ұсыныстар жіберілгендігін айтып, шағым жасайды. Target басшылығы автоматтандырудың қателігін мойындап, наразы болғандардың алдында кешірім сұрауға дайын тұрған еді. Бірақ кейінірек қыздың шын мәнінде жүкті болғандығы анықталды. Алгоритм сатып алушының талғамындағы жүкті әйелдерге лайық өзгерістерді байқап қалып, соның негізінде ұсынытар жіберіп отырған. Big Data түрлі әдіспен қолданылуы мүмкін. Мысалы, ancestry.com сайты қазіргі кездегі қолда бар барлық мәліметтер типін негізге ала отырып, адамзаттың отбасылық тарихын құруға тырысып жатыр. Кітаптардағы қолжазбалардан бастап ДНК-сараптамадағы есептеулерге дейін пайдаланылады. Бүгінде оларға әртүрлі тарихи дәуірлерде өмір сүрген 5 млрд-қа жуық адамдардың профайлдарын, отбасылар арасындағы байланысты сипаттайтын 45 млн генеалогиялық ағашты жинақтаудың сәті түсті. Бұл жұмыстағы басты қиындық - өңделуі тиіс ақпараттардың жеткіліксіздігі және дәлсіздігі. Мәліметтердегі адамдар тізімін тек аты-жөніне қарап емес, туған және қайтыс болған уақыттарына және тағы басқа критерийлер бойынша өңдеу керек. Стандартты алгоритмдер мұндай тапсырмаларды орындай алмайды, ал машиналық есептеу барлық дәлсіздікті ескере отырып, барынша жоғары ықтималдықтағы дұрыс нәтижені көрсетеді. Тағы бір мысал - eHarmony жобасы. Бұл 40 млн адам тіркелген танысу сайты. Сайттағы сауалнамаға 1000-ға дейінгі түрлі ерекшелігіңізді көрсете аласыз. Күн сайын жүйе бір-біріне жақын келетін 100 млн ұсыныс шығарады. Бұл болжамдар қарапайым көрсеткіштерге сүйенбейді. Мысалы, машиналық есептеу профиль суретіндегі бетіңіздің көлемі белгілі-бір адамдар арасындағы байланыстың дамуына ықпал ете алатындығын анықтады. Адамдардың тағамдарға деген талғамдары да қарым-қатынас дамуына әсер етеді. Екі вегетариандықтың өзара қосылу ықтималдылығы 44% бола, гамбургер жақсы көретін жұптың өзара тіл табыспау ықтималдылығы 44 пайызды құрайды. Машиналық есептеуді қолдана отырып, біз олардың қандай принциптер негізінде қабылданатындығын түсінбейміз. Әрине, машиналық есептеуді тура мағынасында жасанды интеллект деп атауға болмайды, ол тек алдын-ала белгіленген тапсырманы ғана орындайды. Бірақ алгоритм негізге алатын жүздеген және мыңдаған факторларды адам санасы ескермеуі мүмкін. Ал арнайы дайындалған алгоритм қолданушы үшін қандай түйісу нүктесі қажет екендігін кез-келген пайдаланушыдан артық біледі. Бұл жерде жақсы тәжірибеге қарағанда өңделген мәліметтер базасының пайдасы көбірек.Дереккөздері:
Мәліметтер келетін дереккөздердің мысалы:- Радиожиілікті идентификаторлардан, есептеуші құрылғылардан түсетін мәліметтер
- Әлеуметтік желілерден келетін хабарламалар
- Метеорологиялық есептеулер
- Ұялы байланыс жүйесіндегі абоненттердің тұрғылықты жері туралы мәліметтер
- Аудио және видеотіркеушілер құрылғыларындағы ақпараттар
Похожие материалы
Новости
Экономика
Олжас Бектенов провел заседание Совета директоров Kazakh Invest
- 11 желтоқсан, 2024