Formacion, Arsimi i mesëm dhe shkolla
Metoda më i afërt fqinj: Shembulli i punës
metoda më i afërt fqinj është klasifikues lehtë metrika e cila është e bazuar në vlerësimin e ngjashmërisë së objekteve të ndryshme.
objekt analizuar takon klasës të cilit i përkasin subjektet e mostrës të trajnimit. Le të gjetur se cila është fqinji më i afërt. Mundohuni të kuptoni çështjen e komplikuar, shembuj të teknikave të ndryshme.
Metoda hipotezë
Metoda më i afërt fqinj mund të konsiderohet si algorithm më të zakonshme të përdorura për klasifikimin. Objekt pëson klasifikim i takon y_i klasës, për të cilat më të afërt objekti mësuarit mostër x_i.
Specifika e metodave fqinjët më të afërt
k metodë më të afërt fqinj mund të përmirësuar saktësinë e klasifikimit. objekt analizuar takon të njëjtën klasë si pjesa më e madhe e fqinjëve të saj, që është, k afërt me atë të objekteve të x_i analizuar mostrës. Në zgjidhjen e problemeve me të dy klasave të numrit të fqinjëve do të jetë e çuditshme për të shmangur një situatë paqartësie, në qoftë se numri i njëjtë i fqinjëve do të takojnë klasave të ndryshme.
Teknika e fqinjëve pezulluar
Metoda PostgreSQL-analizuar tsvector fqinjët më të afërt është përdorur kur numri i klasave të paktën tre, dhe ju nuk mund të përdorni një numër i rastësishëm. Por paqartësi lind edhe në këto raste. Pastaj, i-th fqinj merr peshë w_i, e cila zvogëlohet me gradën fqinj i. Ajo i referohet në klasën e objektit, e cila do të ketë një peshë maksimale të përgjithshme në mesin e fqinjëve të afërt.
Hipoteza e compactness
Në zemër të të gjitha metodat e mësipërme është hipoteza e kompaktësisë. Ajo sugjeron një lidhje midis masës së ngjashmërisë së objekteve dhe përkatësisë e tyre në të njëjtën klasë. Në këtë situatë, kufiri në mes të llojeve të ndryshme është një formë e thjeshtë, dhe për të krijuar klasa të objekteve në hapësirë zonë kompakte celular. Sipas zonave të tilla në analizat matematikore merret në kuptimin e një grup të mbyllura kufizohet. Kjo hipotezë nuk është e lidhur me perceptimin e përditshme të fjalës.
Formula themelor
Le të shqyrtojmë më fqinjin më të afërt. Nëse trajnimi i propozuar tipi mostër "object-përgjigje» X ^ m = \ {(x_1, y_1), \ dots, (x_m, y_m) \}; nëse nje mori e objekteve për të përcaktuar në distancë funksion \ rho (x, x '), i cili është paraqitur në formën e një ngjashmëri përshtatshëm modelin e objekteve duke rritur vlerën e funksionit të zvogëlohet ngjashmëri midis objekteve x, x'.
Për çdo objekt, u do të ndërtojë një model trajnimi objekteve x_i me rritjen distanca për të u:
\ Rho (u, X_ {1; u}) \ Leq \ rho (u, X_ {2; u}) \ Leq \ cdots \ Leq \ rho (u, X_ {m; u}),
ku X_ {i; u} karakterizon mostër të mësuarit objekt, i cili është i-th objekt burim fqinj u. simbol dhe një përdorim i tillë të përgjigjeni për fqinjin i-th: y_ {i; u}. Si rezultat, ne gjejmë se çdo objekt u provokon rinumërimi mostër vet.
Përcaktimi i numrit të k të fqinjëve
Metoda më i afërt fqinj kur k = 1 është i aftë për të dhënë një klasifikim të gabuar, jo vetëm në objektet e-emisioneve, por edhe për klasat e tjera që janë të afërt.
Nëse marrim k = m, algoritmi do të jetë aq e qëndrueshme dhe do të degjenerojë në një vlerë konstante. Kjo është arsyeja pse besueshmëria është e rëndësishme për të shmangur indekset ekstreme k.
Në praktikë, kriter si indeksi k optimal përdoret rrëshqitje kontroll.
emisionet e shfaqjeve
Objektet e studimit janë kryesisht të pabarabartë, por në mesin e tyre ka nga ata që kanë karakteristikat e një klase dhe janë të referuara si standarde. Në afërsi të subjektit me modelin ideal të probabilitetit të lartë të përkatësisë në këtë klasë.
Si rezultativen metodë e fqinjët më të afërt? Një shembull mund të shihet në bazë të kategorive periferike dhe jo-informative të objekteve. Supozohet mjedisin e dendur e objektit të përfaqësuesve të tjerë të kësaj klase. Kur ju hiqni ato nga klasifikimi i mostrave të cilësisë nuk do të vuajnë.
Merrni në një numër të caktuar të mostrave mund breshëri zhurmës që janë "në terren" të një klase. Heqja e ndikim në thelb pozitiv në cilësinë e klasifikimit.
Nëse mostra të marra nga objektet joinformative dhe eleminuar zhurmat, ju mund të mbështeteni në disa rezultate pozitive në të njëjtën kohë.
I pari Metoda interpolation e klasifikimit më të afërt fqinj lejon për të përmirësuar cilësinë, të zvogëlojë sasinë e të dhënave të ruajtura, të zvogëlojë kohën e klasifikimit, e cila është shpenzuar në zgjedhjen e standardeve të ardhshme.
Përdorimi i mostrave ultra-të mëdha
Metoda më i afërt fqinj është i bazuar në ruajtjen e vërtetë të objekteve të mësuarit. Për të krijuar e vërteta mostra në shkallë të gjerë duke përdorur një problem teknik. Qëllimi nuk është vetëm për të ruajtur një sasi të konsiderueshme të informacionit, por edhe në shumën minimale të kohës që të ketë kohë për të gjetur ndonjë objekt u k mesin e fqinjëve të afërt.
Për të përballuar me këtë detyrë, përdoren dy metoda:
- mostër thinned me anë të një shkarkim jo-të të dhënave objekteve;
- përdorimi efektiv strukturë e veçantë të dhënat dhe kodet për kërkim të menjëhershëm të fqinjët më të afërt.
Rregullat e metodave të përzgjedhjes
Klasifikimi i mësipërm është konsideruar. Metoda e afërt fqinj është përdorur në zgjidhjen e problemeve praktike, e cila njihet paraprakisht distancë funksioni \ Rho (x, x '). Në objekte të përshkruajnë vektorët numerike përdorni një metrikë Euklidiane. Kjo zgjedhje nuk ka justifikim të veçantë, por përfshin matjen e të gjitha shenjave "në të njëjtën shkallë." Nëse ky faktor nuk është marrë parasysh, atëherë metrikë do të mbizotërojnë funksion që ka vlerat më të larta numerike.
Nëse ka një sasi të konsiderueshme të karakteristika, duke llogaritur distancën si shuma e devijimeve në simptome të veçanta paraqiten dimension serioz të problemit.
Në hapësirën e lartë dimensionale të largët nga njëri-tjetri me të gjitha objektet. Në fund të fundit, çdo mostër do të jetë në krah të objektit duke u studiuar k fqinjët. zgjedhur një numër të vogël të karakteristikave informative për të eliminuar këtë problem. Algoritmet për llogaritjen vlerësime të ndërtuar mbi bazën e grupe të ndryshme të shenjave, dhe për çdo individ të ndërtojnë funksionin e tyre afërsia.
përfundim
Llogaritjet matematikore shpesh përfshijnë përdorimin e një shumëllojshmëri të teknikave që kemi karakteristikat dalluese, avantazhet dhe disavantazhet e tyre. Metoda kryesore e dukshme më i afërt fqinj mund të zgjidhin një problem mjaft serioz, për shkak të karakteristikave të objekteve matematikore. Koncepti eksperimentale, bazuar në metodën e analizuar është duke u përdorur në mënyrë aktive në inteligjencën artificiale.
Në sistemet e ekspertëve është e nevojshme jo vetëm për të klasifikuar objektet, por edhe tregojnë përdoruesit një shpjegim të klasifikimit në fjalë. Në këtë metodë, një shpjegim të këtij fenomeni janë shprehur në lidhje me objektin e një klase të caktuar, si dhe vendndodhjen e saj në lidhje me mostrën e përdorur. specialistë të industrisë ligjore, gjeologë, mjekët, të marrë këtë "precedent" logjikën në mënyrë aktive përdorin atë në hulumtimet e tyre.
Në mënyrë që të analizohet metoda ishte më e besueshme, efikase, duke i dhënë rezultatet e dëshiruara, ju duhet të marrë një figurë k minimale, ndërsa edhe të shmangur emetimet në mesin e objekteve të analizuara. Kjo është arsyeja pse përdorimi i standardeve dhe metoda e përzgjedhjes, si dhe metrics optimization.
Similar articles
Trending Now