Ein Perzeptron kann nicht alle Datenpunkte klassifizieren, weil es nur in der Lage ist, linear separierbare Daten zu trennen. Das bedeutet, dass die Datenpunkte durch eine gerade Linie (in zwei Dimensionen) oder eine Hyperebene (in höheren Dimensionen) getrennt werden müssen. Wenn die Datenpunkte nicht linear separierbar sind, also wenn sie sich nicht durch eine solche Linie oder Hyperebene trennen lassen, kann ein Perzeptron keine perfekte Klassifikation erreichen. Ein klassisches Beispiel für nicht linear separierbare Daten ist das XOR-Problem, bei dem die Datenpunkte so angeordnet sind, dass keine gerade Linie sie korrekt trennen kann.