Tankar om lineär algebra

Jag har ombetts att sammanfatta tankar och ideer om lineär algebra. Det gäller ämnets mål, dess tillämpningar, dess didaktik, organisation och litteratur.

Ämnet har emellanåt uppfattats som problematiskt. Man kan få hur goda resultat som helst, i procent, utan att åstadkomma särskilt mycket. Vilka resultaten än är uppfattas det ofta som tråkigt och abstrakt, till skillnad från analys. Även studenter som blottar intuition och insikt kan hängivet försäkra att de ingenting begripit.

Det kan verka märkligt eftersom det är lättare att räkna upp, och med namn beskriva, algebrans tillämpningar. Analys verkar mest ligga och puttra under ytan, man skulle bara märka behoven om inte kunskaperna fanns. Inom analysens givna ramar når studenterna relativt likartade mål, men i olika grad. Alla räknar integraler, men klarar olika svåra. En del känner igen kvadratens derivata, andra inte, vilket ger olika resultat på differentialekvationer. Mönsterigenkänning spelar rätt stor roll i både examinationens och tillämpningarnas praktik.

Analysens formspråk, epsilon-delta, supremum, likformighet är det ytterst få som tar till sig, vilket verkar kvitta ur studentens synpunkt. Man ser en stark motsättning mellan teori och räkning, och uppfattar endast det senare som nyttigt. Det skulle vara en mycket stor omvälvning att lägga om analysen mer mot förståelse av de uppräknade grundbegreppen. En del försök nästan 20 år tillbaka har lärt mig att investeringen i tid och mod är riskabel.

Jag tycker inte man ska somna för det. Som analysföreläsare förklarar jag ingående vad gradienter är i koordinater och i geometriska termer. Allt som inbegriper dem visas och illustreras noga. Sen frågar jag längre fram varför det vanliga magnetfältet (vederbörligen illustrerat) inte kan ha potential. Det är väl en eller två av åhörarna som genast ser att en funktion inte kan vara växande runt en cirkel. Tangentplan kan däremot alla räkna ut.

Jag diskuterar nu begreppsförståelse på en annan nivå än den strikt formella.

Med algebran ställs konflikten, om det är någon, på sin spets. Vad är algebra utan teori, utan begrepp, utan formspråk? Tentor på en del håll, stundom även här, antyder en del av svaret. Typuppgifter, bara fånigare, bara mindre relevanta, bara mer stereotypa, än de fånigaste av fåniga analysuppgifter.

Ekvationssystem med parametrar är en av mina käpphästar. Parametrar finns för att variera förutsättningarna och därmed testa olika fall. Blir de problem är problemen genast ointressanta. Räcker det inte med ett a i vänsterledet? Det ska vara två ställen och gärna a2 -1 på ett av dem.

Nyttig logisk träning är det vanliga försvaret. Det var exakt så man försvarade realskolans uppgifter där A, B och C tävlade i att gräva gropar och diken.

Jag kan inte inse annat än att sådant är ett uttryck för bristande självförtroende. Kan vi inte lära ut de abstrakta begreppen måste vi stanna halvvägs. Inom tidsramarna kan vi då istället överarbeta matrisräkningen och geometriuppgifterna på linjer och plan. Baksmällan får andra ta hand om.

Min tes är förstås att algebra inte behöver vara tråkigt, att det finns mål som alla bör se och nå, och att det inte behöver vara särskilt formellt eller abstrakt. Åskådning och känsla måste rimligen vara honnörsorden för matematiken inom civingutbildningarna. Likaså abstraktionsförmåga i meningen att växla mellan abstraktionsnivåerna och att se paralleller mellan likartade fenomen.

Målen

Utöver slentrianen tycks de enda riktmedlen för kursernas utveckling varit sporadiska tillämparsynpunkter.

En numerikprofessor vill ha bort Cramers regel. En elektronikföreläsare tror inget i algebran är viktigare. Båda har fel, men mest fel har de som ältar determininantutveckling i det oändliga, låter detta skymma determinantens ide och egenskaper och fördröjer inträdet i abstraktionernas skimrande värld.

Vad både matematiker och avnämare måste lära sig inse är att vissa aspekter, även några mycket nyttiga, aldrig kan bearbetas till fullo under den korta tid en grundkurs varar. Man måste bestämma sig. Man måste ha så tydliga mål och så tydliga vägar till dessa att alla försummade detaljer vid behov kan anknytas till dem. Tillämpare är ofta övertygade om att våra kurser ser ut som för 30 år sen. De är också övertygade om att studenterna, om de inte känner igen en viss beteckning eller formulering, inte lärt sig något alls.

Det vore bättre att ta reda på hur det är. Det är vad jag konsekvent gjort under 29 år som undervisare och kursutvecklare på LiTH.

Om man t ex föreläser eller övar euklidiska rum ska man inte dröja vid Cauchy-Schwarz som är en återvändsgränd i sammanhanget (och som vid senare behov mycket lätt faller ut ur abstrakta Pythagoras). Och man ska inte räkna tusen uppgifter på Gram-Schmidt (i de mest exotiska skalärprodukter). Målet, tillämpningen, ska synas och motivera alla steg. Målet är förstås minsta-kvadratproblemet. Alla mina kontakter har intygat att detta är ett av de båda huvudmålen i en kurs i lineär algebra.

Man bör fundera hur man, vid målet eller i dess närhet, tydliggör medlen. Jämförelsen med de geometriska specialfallen är en viktig poäng. Den abstrakta teorin kräver bevis för att saker finns. I en grundkurs ska detta vara meningen med Gram-Schmidts förfarande.

Det andra huvudmålet är spektralteori. Det kan rimligen inte stanna vid något så tråkigt som att lösa sekularekvationer. Under min tid som kursledare på Y-linjen (1992-95) gav jag (och min kollega på D) inga poäng för bestämningen av egenvektorer. Man skulle kunna göra något med dem. Kunde man inte det var det mycket svårt att klara tentan; det kunde vara tre eller fyra uppgifter som krävde begreppet. Denna tradition fortsätter.

Spektralteorin är kanske den del av lineära algebran där anknytningar till geometri inte känns tillräckliga (men givetvis nödvändiga). Spektralsatsen säger att det inte finns andra symmetriska avbildningar i geometrin än de triviala. Antiklimax?

Det är därför rimligt att den abstrakta definitionen av symmetriska avbildningar redan i en grundkurs anknyts till någon fysikalisk princip. Det kan vara actio-reactio (svängningar) eller konservation (värmeledning, diffusion). Studentens fråga vad egenvektorer egentligen är bör ges det ärliga svaret: "allt möjligt".

Man kan precisera, förstås. Man delar upp tillstånd i enklare tillstånd med särskilt enkel utveckling, t ex periodicitet (egensvängningar) eller exponentiellt avklingande (värmeledning). Lösningar finns till givna villkor därför att egenvektorer spänner upp det givna rummet; det finns inga fler eftersom egenvektorerna är oberoende. Jag tror, efter senaste omarbetningen av Kossan, att sådana resonemang bör föregå matrisbehandlingen.

På min tid uppfattades kvadratiska former och därtill hörande namnexercis med andragradsytor som verksamhetens krön. Det är väl trevligt att skära i saker för att se hur de ser ut, men jag kan inte tänka mig sämre sätt att klargöra begreppen egenvärde och egenvektor. Den avbildning som överför en given ellipsoid i en lämplig sfär är alls inte den som hör till den kvadratiska formen, utan dess kvadratrot.

Differentialekvationer är definitivt viktigare, om man måste välja. De är också den tydligaste illustrationen av skillnaden mellan diagonaliserbart och icke diagonaliserbart. Eller reella och komplexa egenvärden.

Ett mål som många önskar är SVD. Det vore bra att ha med, eftersom det anknyter de båda målen till varandra. SVD löser behändigt minsta-kvadratproblemet och dess dual (kortaste lösning); det är självt en följd av spektralsatsen. Tillämpningarna är många. Vidare sammanknyter SVD (och kusinen polärfaktorisering) två viktiga avbildningstyper, varandras motsatser.

Argumenten är starka, men tiden sätter stopp. Alla jag talat med tror att en forcering mot ett sådant mål innebär att grunderna offras. Vad kunde strykas? Det skulle (på Y och D) vara isometrier i tre dimensioner, som dock är av viss betydelse i mekanik och robotteknik. Då skulle emellertid en värdefull konkretisering gå förlorad, vilket kan motverka syftet.

Säker är jag inte på denna punkt. I fortsatta diskussioner med avnämare bör dock den frågan alltid ställas: vad ska bort om det ni föreslår ska med?

Vägar till mål.

Diskussionen av målen har snuddat vid några av kursernas tidigaste moment. Geometrin är modell för abstrakta vektorrum och euklidiska rum, därmed för minstakvadratproblemet. Projektion av linje i plan, samt gemensamma normalen till två skeva linjer, ger tidig försmak. Det senare är kanske tydligast; kan vi inte lösa ett system (skära linjerna) kan vi istället minimera avståndet.

Så kom ekvationssystemen, matrisräkningen med. Determinanter hör också till de tekniska grunderna. Dessa moment, eller stadier, måste gå fort och inte dränkas i skymmande komplikationer. Kufiska problem på linjer och plan kan till stor del få stå tillbaka för mer varierad och grundläggande träning att se och använda komposantuppdelningar, bland annat.

Diskussionen om egenvärdesproblem betonade den konkreta innebörden av "spänna upp" och "lineärt beroende" (existens och entydighet). Efter den inledande tekniken etablerar vi lineära algebrans miljö, vektorrum och därtill hörande teori. Det är viktigt att begreppen från första början, och genomgående, anknyts till konkreta föreställningar, och inte bara geometriska. Poängen med dimensionsresultaten, eller en viktig poäng, är att entydighet ofta är lättare att fastställa än existens. Det gäller att ha exempel där detta märks, t ex polynominterpolation.

Detta leder till frågan vilka rum som ska behandlas. Eftersom redan Rn och dess underrum tvingar den allmängiltiga definitionen av vektorrum behövs inte fåniga exempel som man ändå inte gör något med. Polynomrum motiveras av den redan nämnda tillämpningen. Lösningsrum till differentialekvationer är ett likartat exempel. Man behöver emellertid inte, och bör inte, införa alla samtidigt.

Samma gäller lineära avbildningar. Jag har själv betonat geometriska exempel i början, därför att uppgifterna ger resultat som går att se, och därmed kontrollera. Linearitet är i sammanhanget en icke-trivial egenskap, t ex vridningens linearitet är ekvivalent med additionslagarna för sinus och cosinus.

Först i samband med dimensionssatsen brukar jag ta upp evaluationsavbildningar och differentialoperatorer.

En del hävdar att egenvärden och egenvektorer blir enklare om man inte anknyter dem till lineära avbildningar utan till matriser. Jag tror det är ett misstag. Dels innebär det att vektorer förväxlas med sina koordinater, dels blir det nästan omöjligt att förstå vad matriserna T-1AT och A har med varandra att göra. Speciellt som matrisprodukterna ofta inte behöver räknas ut.

Ändå tror jag att man tidigt kan orientera om egenvektorbegreppet i matristermer, utan att öva på det. Det är ett försök i nästa upplaga av Krypa-Gå. Man ser vart man ska, och bygger sedan apparaten för en mer allmängitlig behandling av problemen.

Det är nu värt att påpeka att dimensionssatsen, rang, värderum, nollrum har ytterst lite med kursernas fortsättning att göra. Det är något som studenter måste släppa om de släpar. Tillämpare betonar ofta dessa begrepp utan att klargöra om de behöver mer än orden, som isåfall alltid kan ersättas av annat.

I reglertekniken kommer de in t ex i samband med styrbarhets- och observerhetsmatriserna. Nollrum är där ett lösningsrum, värderum ett kolonnrum, höljet av matrisens kolonner. Att kalla dem något finare mystifierar bara. Ingen egentlig teori aktualiseras!

I vissa kurser betonas begreppen starkt, mest, tror jag, därför att man kan exercera rangberäkningar, och variera tentamensuppgifter, i det oändliga. Används inte begreppen och satserna t ex till existensbevis kan de helt undvaras. Det skulle kanske befria lineära algebran från en tråkighetströskel.

Vi är därmed vid den punkt där det ena huvudmålet, minsta-kvadrat, kan verkställas. Det kan t o m läggas tidigare, före dimensionssatsen, eller lineära avbildningar. Jag ser både för- och nackdelar.

Med teorin för euklidiska rum har också livsmiljön för symmetriska avbildningar upprättats. Precis som för vektorrum gäller att man inte ska förlora sig i exotiska exempel eller axiomatikältande. Funktionsrum tror jag är direkt olämpliga i detta skede. Diagonalviktning kan vara värt att nämna, det tycks vara det vanligaste.

Sist i min uppräkning kommer basbyte. Jag anser att detta ska komma sent. Huvudskälet är att stoffet, trots sin elementära karaktär, blir rörigt annars. Ett skäl, därnäst, är att det blir lättare att ge meningsfulla exempel och övningar. Att i det oändliga öva uppställning av koordinatsamband, utan något att anbringa dem på, är tortyr.

Det visar sig, genom denna lite slingriga uppräkning, att redan en snäv inriktning på två huvudmål motiverar mycket stora delar av gängse kurser. Allt, påstår jag, utom dimensionssatsen och isometrier i låg dimension.

Inget av detta bör dock offras, studenterna bör bara uppmärksammas på möjligheten att lägga detta åt sidan om det tar emot eller blir för mycket.

Detta slags hjälp motiverar förändrade lärarroller och umgängesformer. Avskrivningslektioner försvinner om det inte finns tavlor där man möts.

Föreläsningar

Y- och D-linjens kurser hade 1978-1992 enbart lektioner, s k storseminarier. Detta är formen för dagens kurser på M och I.

Jag tror meningen, när föreläsningar ströks, var att det inte skulle föreläsas alls. Jag fann det värt att pröva, eftersom en misslyckad eller opsykologisk föreläsning kan ge avsmak och motverka studentaktivitet. Jag hoppades i c:a 10 år på intressanta effekter när studenter arbetade med en mångfald uppgifter, helst i förväg, och inviterades att se mönster och dra slutsatser.

Om det var bra eller dåligt fick jag aldrig veta. Jag var för ensam, och ansatsen var för främmande för studenterna. Jag har därför letts till slutsatsen att kurser i matematik, utan undantag, ska ha föreläsningar, c:a 6 timmar per poäng.

Det är mycket tydligt att storseminariekurser är långtifrån föreläsningsfria. Det pratas mycket, och framförallt mer om saker som inte alls är tacksamma att föreläsa. Det kan vara en fråga om bristande självförtroende, men än så länge är det lyckligtvis en idiotförklaring att från tavlan beskriva hur man löser ekvationssystem.

Jag fann Y-linjens föreläsningsvolym, 14 föreläsningar, optimal. Den tvingade till beslut utan hets och utan godtyckliga luckor eller hopp. Det var möjligt att ge en rätt koncentrerad överblick, men också enstaka utblickar. Man slapp föreläsa matrisräkning!

Lektioner

När jag blev kursledare på riktigt, 1992, försökte jag reformera lektionerna. Jag ville, på sikt, avskaffa allt salsräknande och låta allt utgå från studenternas presentationer på tavlan. Det var orealistiskt och inte helt nödvändigt. Studenterna känner inget större behov av att effektivisera såpass väl tilltagen lektionstid. Att pressa dem till bättre förberedelser genom en minskning torde inte heller hjälpa. Snarast ökar det trycket mot lärarna att demonstrera uppgifter.

Eftersom lineära algebran känns främmande och abstrakt, med uppgifter som inte omedelbart utpekar lösningsgången (de kan egentligen vara hur enkla som helst) kan vi alltid räkna med ett sådant tryck. Det är oerhört viktigt att inte ge efter. Endast genom eget arbete i många enkla, och rikt varierade, uppgifter kan genomsnittsstudenten öva upp förtrogenhet, mönsterigenkänning och känsla. Kursledaren har en viktig roll, men är mest utsatt. Detta aktualiserar frågan om klarare stöd från ledande håll.

Lika viktigt är förstås att uppgiftsövandets karaktär av medel betonas genom täta uppföljningar. I grupper där studenterna är väl förberedda kan man ha fungerande tavelverksamhet större delen av kursen. Erfarenheten har visat att detta ger överlägsna resultat.

Litteratur

Ifråga om litteratur är jag part i målet. Men jag skrev böcker för att fylla luckor och blir oftast ytterst deprimerad när jag går igenom befintlig litteratur. Utvecklingen går definitivt åt fel håll.

Realistiskt kan vi diskutera svensk och nordamerikansk litteratur. Svenska böcker är ofta kortfattade och snävt anpassade till kurser på författarens arbetsplats. Detta tar sig emellanåt parodiska uttryck.

Ett undantag (i det senare avseendet) är K-G Anderssons bok som nu spolats i Lund. Jag antar att min bok kommer att gå samma väg; en del påstår att dessa två är de enda riktiga böckerna i lineär algebra på svenska.

Amerikanska böcker är svulstiga, långrandiga och pratiga. De är gjorda för den anglosaxiska skedmatningstraditionen med många korta föreläsningar. Att ha dem som följeslagare i våra mer koncentrerade kurser är frustrerande, organisationen är alldeles för ineffektiv. Hur studenterna ska vinna överblick begriper jag inte. Det är kanske inte vad de själva efterfrågar, i utgångsläget, men utgångslägen ska övervinnas.

Typuppgiftstänkandet cementeras när blotta långrandigheten håller teorins olika delar noga isär.

Medan amerikanarna slösar med grafik och färg missar de ibland poängerna på ett hårresande sätt. Anton och Edwards- Penney har inte en enda figur som illusterar linearitet! Dessa författare betonar inte hur basbilder kan avläsas eller ställas upp, dvs. att en lineär avbildning framgår ur ett fåtal data. Eftersom de därigenom alltid måste arbeta med godtyckliga vektorer blir linearitet något som utläses ur uttrycken. Geometrin försvinner i ett moln av siffror.

Lays bok brukar framhållas, och används på många ställen. Den har många trevliga, och flera onödiga, tillämpningar. Tyvärr är den lika steril i det geometriska och lika plottrigt organiserad, som de flesta av konkurrenterna.

De svenska böcker jag granskat är desto mer överskådliga och koncisa, rentav till överdrift. Jag lutar åt att någon av dem kan begagnas på M och I, efter kompletteringar. I ett hänseende är de säkert jämbördiga, nämligen geometrin. Där är den svenska traditionen mycket stark, medan den amerikanska gör siffror av allting.

Huvudkandidaterna är Gunnar Sparrs Lunda-bok, Anders Tengstrands Växjö-bok, samt Luleboken med många författare, alla på Studentlitteratur.

Sparrs bok har inget om kvadratiska former eller differentialekvationer, vilket bör vara lätt att åtgöra med kompletterande material. Boken är överlag uppskattad i Lund, mycket därför att den har skygglappar. Studenter kan stegra sig inför stoff som inte genast sätter sig men inte angår alla. Jag tror att valfrihet aldrig kan vara fel; vidare är det en olycka att svenska förlagsutgivna kurskompendier är så klena följeslagare genom senare stadier av utbildningen.

Den allvarligaste bristen, enligt kolleger, är att endast vektorrumet Rn införes, inte ens dess olika underrum. Då blir det svårt att motivera att man visar satser av typen "rätt antal element ger: oberoende omm spänner upp" - båda egenskaperna är nämligen exakt lika lätta att verifiera i Rn. Ändå dyker underrummen upp i skepnad av nollrum och värderum i avsnittet om dimensionssatsen. Ser man att de är exempel på samma sak som hela rummet Rn?

Det mesta kan upprepas beträffande Luleboken som dock har den stora fördelen av många övningsuppgifter, åtskilliga riktigt bra. Övningsuppgifter i separata häften konserverar uppfattningen om övandet, "praktiken", som något helt skilt från "teorin".

Tengstrands bok stannar väldigt länge i tre dimensioner. Sen görs det mesta om och det går fort.

Dimensionssatsen i tre dimensioner blir smått komisk - kanske detta faktum leder studenten att inse att n dimensioner inte är märkvärdigare än 3. Tillämpningarna borde klargöra detta. Den tillämpning som genomföres (f ö även i Luleboken) är nu minsta-kvadrat-problemet (i Sparrs bok är den en notis!). Den allmänna rangteorin visar att AtAX = AtB är lösbar, det är sedan enkelt att verifiera att lösningen (evt. lösningarna) ger önskat minimum. Då försvinner geometrin. Jag finner det mycket naturligare att först visa projektionens existens, varpå lösbarheten är omedelbar. Normalekvationerna är dessutom inte det viktigaste; alla av mig kända verksamma numeriska förfaranden tar sats i geometrin.

I det allmänna avsnittet om baser och dimension är prioriteringarna och formuleringarna märkliga. Sats 1 lyder "Om ett ändligdimensionellt lineärt vektorrum spänns upp av k vektorer så är alltid fler än k vektorer lineärt beroende": Det är obegripligt. Det borde stå "så är varje svit med fler än k vektorer beroende". Sats 2 formulerar dimensionens invarians men satslydelsen sammanfattar inte vad felet är med sviter med fler eller färre element.

Sats 3, om utfyllnad till bas, får en egendomligt framskjuten position, med pedantiskt bevis, medan den kraftfulla satsen om "rätt antal element" inte formuleras alls. Den flitige författaren har nog haft lite bråttom här, precis som själva boken.

Gemensamt för båda böckerna är den svåra axiomatiska framställningen av determinanter. Den mest konkreta och lättförstådda framställning jag vet är den hos G.Shilov. Jag stal den redan 1974.

Det vore inte rättvist att säga att Luleboken behandlar determinanter av godtycklig ordning.

Sätter man in böckerna i sammanhanget av undervisning med tuktad föreläsningsvolym tror jag Tengstrand och Luleboken är lättast att komplettera. Den boken har till skillnad från Sparr (och i likhet med Luleboken) övningsuppgifter, men fler och bättre behövs.

Som alternativ har föreslagits populariserade versioner av Krypa-Gå och Kossan. Att bara skära i dem verkar fånigt, det kan studenterna göra själva. Jag kan möjligen tänka mig ett gruppjobb framgent. Jag har arbetat ensam med mina böcker i 25 resp. 17 år och kan behöva friska infall från kolleger.

Datorstöd

Jag har inte sett något som är bra.

Examination

Det pratas mycket strunt i denna fråga.

Hur det fortsätter

Det är värt att ägna några ord åt kursens fortsättning. Hur förvaltas och underhålles kunskapen?

Den första tillämpningen är flervariabelanalys. Kursen aktualiserar euklidiska rum (ty analysen sker där), abstrakta grundbegrepp som lineärt beroende (lagrange) med geometriska tolkningar, determinanter och deras geometri, samt kvadratiska former. Olineära avbildningar lineariseras och man ska veta vad det innebär.

Åtminstone på Y och D betonas algebran kraftigt vilket (med gillande) noteras på kursvärderingar. På D sker detta dock med avsevärd fördröjning, ett ofrånkomligt resultat av de s k tematerminerna.

För både Y- och D-linjens del har jag funnit det besvärande att ett så viktigt och välskött ämne som reglerteknik kommer så sent. Tillståndsteorin är en härlig tillämpning av lineär algebra (och mycket annat). På Y skulle detta kompenseras genom en omstrukturering av numerisk analys, vilken diskuterats på ämneskonferenser. Mer numerisk lineär algebra, SVD, QR, isometriska metoder för minsta-kvadrat. En sådan förändring är hett begärd av signalbehandlare i både en och två dimensioner.

På D diskuterar vi idag en systemteoretisk termin som skulle kunna ligga redan på våren i tvåan. Tanken är bl a att ersätta de 5 poäng matematik som försvinner när Analys F läggs ned. Lineär Algebra finge då sin naturliga fortsättning i Lineär Analys, transformer men också en del specialiserad lineär algebra.

En del av detta finns förberett i mina böcker.

På M är det hållfasthetslära och stela kroppen som tätast efter analys B förbrukar lineär algebra. Jag blir bestört när teknologer långt upp i årskurserna tvärsäkert hävdar att algebran för dem aldrig var annat än självändamål. Något är fel någonstans.

Beträffande I-linjen sammanfaller några av de viktigate tillämpningarna med dem för M. Angående ekonomiska tillämpningar har jag inte lyckats utröna så mycket. Tre förfrågningar hos produktionsekonomerna har lämnats obesvarade

Så länge I och M fungerar som inbördes oberoende kurser är det värt att undersöka om vardera kan profileras mot sina speciella tillämpningar. Sådant betyder mycket för humöret och viljan. Idag undrar en del M-studenter varför Y- och D-linjens kurs är så mycket mer "praktisk" än deras.

Linköping den 1 februari 1999 (och 14 juni 2000)

Peter Hackman

Till tablån