Нұсқалық кеңістікті оқыту - Version space learning - Wikipedia

Екі өлшемдегі «тіктөртбұрыш» гипотеза тілінің нұсқасы. Жасыл плюс - жағымды мысалдар, ал қызыл дөңгелектер - жағымсыз мысалдар. ГБ максималды жалпы оң гипотеза шекарасы, ал SB максималды нақты оң гипотеза шекарасы. Аралық (жіңішке) тіктөртбұрыштар нұсқа кеңістігіндегі гипотезаларды білдіреді.

Нұсқалық кеңістікті оқыту Бұл логикалық тәсіл машиналық оқыту, нақты екілік классификация. Версиялық кеңістікті оқыту алгоритмдері алдын ала анықталған кеңістікті іздейді гипотезалар жиынтығы ретінде қарастырылды логикалық сөйлемдер. Формальды түрде гипотеза кеңістігі а дизъюнкция[1]

(яғни, 1-гипотеза немесе 2-гипотеза немесе 1-ден 1-ге дейінгі гипотезалардың кез-келген жиынтығы) n). Кеңістікті оқыту алгоритмінің нұсқалары мысалдармен ұсынылған, ол гипотеза кеңістігін шектеу үшін қолданылады; әр мысал үшін х, бұл гипотезалар сәйкес келмейді бірге х кеңістіктен шығарылады.[2] Гипотеза кеңістігінің бұл қайталанатын нақтылануы деп аталады кандидатты жою алгоритм, алгоритм ішінде сақталатын гипотеза кеңістігі нұсқа кеңістігі.[1]

Нұсқа кеңістігінің алгоритмі

Гипотезалар бойынша жалпылықтың реті бар параметрлерде нұсқалар кеңістігін екі гипотезалар жиынтығымен ұсынуға болады: (1) ең нақты сәйкес гипотезалар және (2) ең жалпы дәйекті гипотезалар, мұндағы «дәйекті» бақыланатын мәліметтермен келісімді білдіреді.

Ең нақты гипотезалар (яғни нақты шекара) СБ) бақылаудың оң мысалдарын, ал қалғанының аз бөлігін қамтуы керек кеңістік мүмкіндігінше. Бұл гипотезалар, егер одан әрі төмендетілсе, алып тастау а оң оқыту үлгісі, демек, сәйкес келмейтін болады. Бұл минималды гипотезалар шын мәнінде нақты тұжырымдаманы тек сол арқылы анықтайды деген пессимистік пікірді құрайды оң қазірдің өзінде бақыланған деректер: Осылайша, егер романның (бұрын-соңды болмаған) нүктесі байқалса, оны теріс деп қабылдау керек. (Яғни, егер бұрын деректер жоқ болса, онда ол жоққа шығарылады)

Ең жалпы гипотезалар (яғни, жалпы шекара) ГБ) байқалған жағымды жаттығу мысалдарын қамту керек, сонымен қатар жағымсыз жаттығу мысалдарын қоспастан қалған ерекшелік кеңістігін қамту керек. Егер олар кеңейтілсе, қосу а теріс оқыту үлгісі, демек, сәйкес келмейтін болады. Бұл максималды гипотезалар шын мәнінде нақты тұжырымдаманы тек анықтайтын деген оптимистік пікірді құрайды теріс қазірдің өзінде бақыланған деректер: Осылайша, егер жаңа (бұрын-соңды болмаған) деректер нүктесі байқалса, оны оң деп санау керек. (Яғни, егер деректер бұрын алынып тасталмаған болса, онда ол)

Осылайша, оқыту барысында нұсқалар кеңістігі (өзі жиынтығы - мүмкін шексіз болуы мүмкін) барлық дәйекті гипотезалар) тек оның төменгі және жоғарғы шектерімен (максималды жалпы және максималды спецификалық гипотезалар жиынтығы) ұсынылуы мүмкін, ал оқу әрекеттері дәл осы репрезентативті жиындарда орындалуы мүмкін.

Оқығаннан кейін, жіктеуді алгоритм бойынша үйренген гипотезаны тексеру арқылы көзге көрінбейтін мысалдар бойынша жүргізуге болады. Егер мысал бірнеше гипотезаларға сәйкес келсе, көпшілік дауыс беру ережесін қолдануға болады.[1]

Тарихи негіздер

Нұсқа кеңістігі туралы ұғымды Митчелл 1980 жылдардың басында енгізді[2] контекстінде бақыланатын оқытудың негізгі проблемасын түсінудің негізі ретінде шешім іздеу. Дегенмен негізгі «кандидатты жою«нұсқалық кеңістіктің шеңберімен бірге жүретін іздеу әдісі танымал оқыту алгоритмі емес, әзірленген кейбір практикалық бағдарламалар бар (мысалы, Sverdlik & Reynolds 1992, Hong & Tsang 1997, Dubois & Quafafou 2002).

Нұсқа кеңістігін оқытудың маңызды кемшілігі - оның шу көтере алмауы: кез-келген қарама-қайшы мысалдар нұсқа кеңістігін тудыруы мүмкін құлау, яғни бос болады, сондықтан жіктеу мүмкін болмайды.[1] Бұл мәселенің бір шешімін Дубуа мен Куафафу ұсынды, олар өрескел нұсқа кеңістігін ұсынды[3], мұнда сәйкес келмейтін мәліметтер болған кезде белгілі және мүмкін гипотезаны білу үшін өрескел жиынтыққа негізделген жуықтау қолданылады.

Сондай-ақ қараңыз

  • Ресми тұжырымдаманы талдау
  • Индуктивті логикалық бағдарламалау
  • Дөрекі жиынтық. [Дөрекі жиынтық шеңбері екіұштылықты кедейлер енгізген жағдайға бағытталған мүмкіндіктер жиынтығы. Яғни, мақсатты тұжырымдаманы батыл сипаттауға болмайды, өйткені қол жетімді мүмкіндіктер жиынтығы әртүрлі санаттарға жататын объектілерді ажырата алмайды. Нұсқа кеңістігінің шеңбері екіұштылықты кедейлер енгізетін (классикалық индукция) жағдайға бағытталған деректер жиынтығы. Яғни, мақсатты тұжырымдаманы шешімді түрде сипаттауға болмайды, өйткені қолда бар мәліметтер гипотезаны таңдай алмайды. Әрине, екіұштылықтың екі түрі де бір оқу мәселесінде орын алуы мүмкін.]
  • Индуктивті ойлау. [Индукцияның жалпы мәселесі туралы.]

Әдебиеттер тізімі

  1. ^ а б c г. Рассел, Стюарт; Норвиг, Петр (2003) [1995]. Жасанды интеллект: қазіргі заманғы тәсіл (2-ші басылым). Prentice Hall. 683–686 бет. ISBN  978-0137903955.
  2. ^ а б Митчелл, Том М. (1982). «Жалпылау іздеу ретінде». Жасанды интеллект. 18 (2): 203–226. дои:10.1016/0004-3702(82)90040-6.
  3. ^ Дюбуа, Винсент; Куафафу, Мохамед (2002). «Жақындастырумен тұжырымдамалық оқыту: өрескел кеңістіктер». Есептеудің өрескел жиынтығы және қазіргі тенденциялар: Үшінші халықаралық конференция материалдары, RSCTC 2002 ж. Малверн, Пенсильвания. 239–246 бет. дои:10.1007/3-540-45813-1_31.