Design: Metod / mätinstrument

  • An inter-rater reliability study of a modified version of SATS as a prehospital triage tool

    Med stor glädje har jag idag läst en mycket intressant studie från min doktorandkollega Louise i Region Gävleborg samt medförfattare. Hon har i en prospektiv studie undersökt inter-rater-reliabiliteten i triagesystemet South African Triage Scale (SATS) i den implementation som används i vår region. Totalt 34 sjuksköterskor svarade på ett rejält, digitalt frågebatteri där uppgiften var att triagera 30 prehospitala patientfall beskrivna i text. I SATS-triage ingår dels ett antal vitalparametrar som är numerära, men även bedömningar om mobilitet, en ja/nej-fråga huruvida patienten varit utsatt för trauma, en möjlighet att knyta en diskriminator till patienten som då höjer triageprioriteten (ex.vis ofri luftväg, fraktur i central led/extremitet, bröstsmärta med stark misstanke om AKS m.m.) samt till sist en möjlighet att manuellt triagera upp patienten på vårdarens kliniska bedömning. Således är relativt tydliga bedömningsaspekter med tänkbar subjektivitet införda på ett antal ställen i triagesystemet, i syfte att öka sensitiviteten för tidskritisk sjukdom.

    Vad fann då författarna? Jo, dessvärre var inter-rater-reliabiliteten rejält svag med en Krippendorff alpha på 0.60. Det kan nog enklast översättas till icke godkänt utifrån att >0.8 anses indikera tillförlitlig överensstämmelse som går att dra slutsatser utifrån, 0.67-0.79 måttlig överensstämmelse och <0.67 dålig överensstämmelse. När triagen delades in två kategorier med bara akut (röd, orange) och icke akut (gul, grön), vilket är ett intressant experiment utifrån att det grovt indikerar hur väl triagesystemet kan skilja ut akuta patienter, blev värdet än sämre, 0.47.

    Vad reflekterar man kring det här då? Jo, till att börja med tycker jag det är en mycket ambitiös och läsvärd studie. Möjligen nästan för ambitiös. Jag är faktiskt själv deltagare i studien, och det var ett digert arbete att gå igenom alla fall, som tog mig nånstans runt 2 timmar. Kanske har utmattning hos deltagarna bidragit till ett svagt resultat? Detta resonerar författarna själva kring. Sen är det ju omöjligt att säga något annat än att det är ett gravt bekymmersamt resultat. Jag ska väl börja med att på något vis ange lite bias. Jag har nämligen själv inte varit särskilt övertygad om den här implementationen av SATS-triage, som jag upplevde gjordes på ganska lösa grunder för ett antal år sedan (det är beklagligt att saken inte studerats förrän nu) och som jag varit en flitig kritiker av. Detta ska dock inte missförstås som att jag menar att något annat triagesystem nödvändigtvis är så mycket bättre, och det ska även sägas att systemet förbättrats en hel del sedan det infördes. Med detta sagt så handlade ju min kritik dock initialt mycket om detta. Systemet motiverades vid införande med att RETTS (som vi hade innan) gav för många röda patienter, utan att detta kvantifierats i någon objektiv mätning av under- och övertriage. SATS upplevdes av mig som betydligt mer återhållsamt än RETTS vad gäller hög prioritet, och i den initiala utbildningen uppmanades vi användare också att manuellt prioritera upp patienter – det presenterades som en styrka att man som sjuksköterska därmed fick chans att göra egna bedömningar, som svar på bland annat kritik mot just inter-rater-reliabiliteten. För egen del tänker jag alltså att detta kan vara en bidragande faktor – att vi som använder systemet faktiskt uppmanats att subjektivt triagera upp patienter betydligt mer friskt än med tidigare triagesystem. I slutändan så har dock även konkurrerande system stora brister, så gräset är säkert inte särskilt mycket grönare på andra sidan. Det behövs väl helt enkelt avsevärt mycket mer forskning på de triagesystem som används (stödet för att alls använda dylika verktyg i prehospital vård är ju generellt sett mycket svagt), och särskilt när man väljer att som här implementera ett system med rejält mycket lokala anpassningar. Därför är det oerhört glada nyheter att forskning såsom i denna artikel bedrivs, och jag vet ju att Louise m.fl. har mer forskning på väg på ämnet, vilket är det bästa som kan hända! Jag tycker nu det vore väldigt intressant om de ville kvantifiera graden av över- och undertriage med SATS – och allra helst då om det kunde göras i en jämförelse mot RETTS utifrån att det sistnämnda är så dominerande i Sverige. För som sagt… Gräset är kanske inte så mycket grönare, och alla system har sina svagheter. Patientfallen i aktuell studie var krävande, och jag tolkade dem som utvalda just för att de kunde visa på svagheter och diskrepanser, så med enklare fall (läs: en lite mer tillrättalagd studie) kunde resultatet säkert varit mer positivt… Ser fram emot kommande studier från detta forskargäng!

    Deshayes, L.; Hagiwara, M. A.; Wladis, A.; Bäckström, D. An inter-rater reliability study of a modified version of SATS as a prehospital triage tool. Scandinavian Journal of Trauma, Resuscitation and Emergency Medicine 2026;34(1). doi:10.1186/s13049-026-01648-8
  • Feasibility and diagnostic accuracy of paramedic-performed prehospital point-of-care ultrasound: a retrospective observational study

    Dagens studie är en väldigt spännande sådan på temat POCUS, alltså ultraljud (point-of-care ultrasound) i prehospital miljö och med icke-läkare som utförare. Författarna gav paramedics i Tyskland en strukturerad utbildning inkl. både teoretisk och praktisk träning. Sedan följde de upp användningen av ultraljud i två år, där klinikerna fick ha med sig ultraljudsapparaten i sitt prehospitala dagliga arbete och använda den där de bedömde det indicerat. De protokoll som inkluderades i träningen var lungultraljud (LUS), eFAST vid trauma, ultraljud av hjärtat (FoCUS), ultraljud vid chock och hypotension (RUSH), ultraljud för intravenös nålsättning (USGIV) och ekokardiografi vid avancerad hjärt-lungräddning (ELS). Sammanfattningsvis visade sig POCUS vara fullt möjligt att lära paramedics med en rimlig nivå av diagnostisk säkerhet (sensitivitet 88% och specificitet 93% om man ser till alla undersökningar). Personalens inställning till ultraljud blev också betydligt mer positiv i och med träningen.

    Alla får läsa studien och värdera siffrorna för egen del, där finns siffror och diskussion kring varje respektive undersökning. Jag är själv inte särskilt kompetent på området, men är ganska övertygad sedan ett antal år att ultraljud är något som kommer finnas i varje ALS-ambulans i framtiden. Känner att det börjar bli hög tid att lära sig detta på något vis, så ska nog försöka fördjupa mig på ämnet i framtiden… Mer forskning behövs naturligtvis här såsom på många områden, så vi vet hur vi kan implementera kunskaperna bäst.

    Boehm, A.; Bexten, T.; Stanley, M.; Westphal, D.; Buder, R.; Konrad-Borgstaedt, F.; Benoehr, P. Feasibility and diagnostic accuracy of paramedic-performed prehospital point-of-care ultrasound: a retrospective observational study. Scandinavian Journal of Trauma, Resuscitation and Emergency Medicine 2026;34(1). doi:10.1186/s13049-026-01595-4
  • Survival effect of prehospital emergency anaesthesia with intubation in risk-stratified patients with major trauma: a causal modelling study

    Dagens studie är på tema trauma och prehospital intubation hos patienter utsatta för massivt trauma, publicerad i The Lancet. Författarna har studerat patienter (n=6467) från ett brittiskt traumacenter och använt AI och maskininlärning för att göra en tämligen komplex analys där 30-dagarsöverlevnad och behovet av tidig intubation förutsägs utifrån parametrar i ambulansjournalen (OBS! Modellen förutspådde alltså inte behov av prehospital intubation som sådan, utan “tidig” intubation). Utifrån detta har man sedan tittat på överlevnadseffekten av prehospital intubation med en statistisk metod som heter doubly robust estimation. Huvudresultaten, ur mitt perspektiv:

    • Både 30-dagarsmortalitet och sannolikheten för tidig intubation gick att förutsäga ganska väl utifrån tidiga prehospitala data.
    • I den grupp som modellen klassade som hög sannolikhet för tidig intubation var prehospital intubation kopplad till cirka 10 procentenheters lägre 30-dagarsmortalitet (absolut skillnad). I lågriskgruppen sågs inte samma nytta.

    Studien känns intressant av flera skäl. Dels är metoden ny för mig, och jag medger att jag kämpade en del med att förstå de analyser som utförts. Möjligheten som AI ger att göra så här pass ambitiösa kausala analyser baserat på observationsdata är förstås oerhört intressant, inte minst i den prehospitala vården. Man når inte RCT:ers evidensgrad, men när RCT:er är svåra att genomföra av etiska och praktiska skäl – vilket de ofta är i prehospital vård – är alternativen mycket välkomna. Det är också intressant att behovet av tidig intubation i så hög grad var förutsägbart, eftersom den typen av logik kan utgöra grund för framtida beslutsstöd, vilket även diskuteras av författarna.

    Jag ser dock också en del svagheter. Kausaliteten vilar på att justering mot Intub-8 är tillräcklig, och det är svårt att veta om tillräckligt många variabler faktiskt fångas upp. Det ter sig någonstans som att modellen fångar upp de sjukaste patienterna, och då blir analysen också känslig för confounders. Intubation är ju knappast den enda intervention dessa patienter utsätts för, utan är oftast – vilket författarna också resonerar om – snarare att se som en del av ett helt “paket” av interventioner runt patienten, ofta med andra kompetensnivåer, logistik och vårdkedja. Detta har man försökt justera för, men det är svårt att veta om man missat någon viktig variabel, vilket gör att en randomiserad kontrollerad design ofrånkomligen skulle vara starkare.

    Tyvärr blir det därför lätt att få känslan av att man slår in en öppen dörr: att underbehandling är dåligt (typ “det är ogynnsamt att inte intubera om modellen förutsäger att tidig intubation behövs”) – vilket i sig kan kännas rätt uppenbart. Det intressanta är i stället, i mitt tycke, studiens bidrag till att identifiera vilka som faktiskt vinner på tidig (prehospital?) intubation, snarare än att detta ska baseras på magkänsla.

    Den största tveksamheten gäller dock egentligen analyserna av kostnader och hälsoekonomi, där flera antaganden staplas på varandra. Ur trovärdighetsperspektiv känns det nästan som att författarna hade tjänat på att avstå den delen eller publicera den separat. Summa summarum tänker jag att studien är viktig, dels för att den är starkare än majoriteten av tidigare studier, men också för att den pekar ut en grupp patienter som tycks gynnas av prehospital intubationsförmåga – vilket stärker tidigare resultat kring TBI-patienter. (Även i denna studie var topp-prediktorn för behov av tidig intubation nedsatt GCS, vilket ofta torde hänga ihop med TBI.) Delen om kostnadseffektiviteten hade de kunnat skippa för min del, och det faktum att resultatavsnittet avslutas med: “Taken together, these findings indicate that—on NICE cost-effectiveness criteria—the national cost of HEMS is economically justified by targeted prehospital intubation alone.” blir tyvärr en formulering som inte stärker mitt intryck eller mina takeaways från studien – även om det, strikt utifrån analyserna (med deras respektive svagheter), kan vara ett korrekt påstående. Det blir en väldigt stark retorik, vilande på väldigt många antaganden.

    Nelson, A. P.; Dodds, N.; Zeina, M.; Balston, A.; Giles, D.; Seligman, W. H.; Jha, A.; Nachev, P.; Thompson, J. Survival effect of prehospital emergency anaesthesia with intubation in risk-stratified patients with major trauma: a causal modelling study. The Lancet Respiratory Medicine 2026. doi:10.1016/s2213-2600(25)00370-4
  • Aggressive Behavior Risk Assessment Tool for Emergency Medical Services

    Igår berördes Bröset Violence Checklist här på Prehospitalt med en studie från akutmottagningskontext. Resultaten var väl inte övertygande, men studien hade också flera avgörande frågetecken och det finns studier där resultatet vid en snabb anblick ter sig lite mer optimistiskt. Ett av mina största orosmoment i den högaktuella hot- och våldsfrågan är som jag tidigare sagt att vi förhastar oss och inför mindre genomtänkta åtgärder. Idag har jag därför breddat perspektiven litegrann och tittat på en studie som faktiskt berör ett verktyg för tidig hot- och våldsriskbedömning i ambulanssjukvård, istället för i någon annan kontext. Verktyget heter the Aggressive Behaviour Risk Assessment Tool for Emergency Medical Services (ABRAT-EMS). Dagens studie är en tidig studie för att ta fram verktyget, baserat på en motsvarighet för akutmottagningskontext (ABRAT-ED), vilket är bättre beforskat med både validering i multisite-studie samt en interventionsstudie där verktyget då det användes som del i triage visade sig minska antalet faktiska våldsincidenter.

    I studien på ABRAT-EMS så inkluderades 9.024 patienter, varav 105 (1.16%) av dem resulterade i minst en våldshändelse. Ambulanspersonalen fick fylla i en modifierad version av ABRAT-ED. Denna innehåller i grunden sju bedömningspunkter, varav två handlar om historik, fyra om beteende och en sökorsak, där varje punkt kan generera olika antal poäng. Utfallet i skattningen jämfördes sedan mot utfallet i faktiska händelser, som värderades med Violent Event Severity Tool (VEST), och därefter analyserades detta med regression för att identifiera vilka ABRAT-parametrar som var relevanta för att förutsäga prehospitalt våld.

    Lite fynd från studien:

    • Tre parametrar var signifikanta för att kunna förutsäga prehospitalt våld: agitation, konfusion och aggressivt/hotfullt beteende. Dessa inkluderades alltså i skalan ABRAT-EMS.
    • Med dessa tre parametrar och en cutoff-poäng på ett (1) var sensitivitet och specificitet 82.9% resp. 88.1%, innebärande att verktyget korrekt identifierade 82.9% av patienter som blev hotfulla/våldsamma (true positive) och 88.1% av de som var icke våldsamma (true negative).
    • Vid en cutoff på fyra (4) så blev 75 av 219 identifierade patienter (34.2%) våldsamma, och fortfarande blev 99.7% av de patienter som inte föll ut inte vålssamma.
    • Författarna föreslår i sin diskussion att verktyget ska tolkas som ABRAT-EMS ≥ 4 ska betraktas som högrisk, 1-3 som medium risk och 0 som låg risk. Högrisk skulle då utifrån studiens resultat ha potential att identifiera 71.4% av alla våldsamma patienter. Författarna föreslår också att denna högsta nivå förenas med olika slags säkerhetsåtgärder (kanske är det då vi överväger att avvakta polis eller annat stöd?), medan medium risk torde gå att hantera med lågaffektivt bemötande, medvetenhet och kontinuerlig riskbedömning. Låg risk föreslår de kan hanteras utan ytterligare säkerhetsåtgärder.

    Så, vad innebär allt detta? Jag tänker att resultatet är lovande, men begränsat såtillvida att det är en enda studie, förhållandevis liten, icke randomiserad och den riskerar vara kontextberoende. Dock är ju en styrka att den baserar sig på ett verktyg validerat i akutmottagningskontext, och att dagens studie ändå utgör en påbörjad validering för prehospital kontext. Om vi jämför med Bröset så har ju den skalan avsevärt fler studier bakom sig (främst i psykiatrikontext) – men den prehospitala förankringen tycks obefintlig. Med ABRAT-EMS föll ju fyra av sju bedömningsparametrar bort från ABRAT-ED, vilket indikerar ganska tydligt att sammanhangen inte är fullt jämförbara. Så, även om ABRAT-EMS behöver stärkas avsevärt mer i forskning är det i mitt tycke svårt att argumentera att Bröset skulle ha en starkare position för prehospital användning. Det är ju också lite ”irriterande” (får man säga så?) att ABRAT-EMS påvisar så pass mycket bättre siffror än Bröset-studien igår.

    Jag tänker att svensk ambulanssjukvård har ett vägval att göra… Vi tycks redan ha gått en bit in på Bröset-vägen, och kanske är den rätt väg att gå…? Men jag kan inte låta bli att fundera över i hur hög grad prehospitala hänsyn tagits där, eller om den vägen valts bara för att personal med erfarenhet från psykiatrin – som förmodligen ofta blir involverade när ambulanssjukvården ska avgöra hur hotfulla patienter ska tas omhand – är vana vid den skalan? Lågt hängande frukt osv… Att den funkar i psykiatrin kan såklart vara en styrka, men den prehospitala miljön skiljer sig bevisligen och just detta är anledningen att vi bör förlita oss på studier, och inte bara tyckande, tidigare erfarenheter eller känslor, så som jag var inne på för någon dag sedan. För egen del tycker jag samtliga som jobbar med dessa frågor i svenska ambulansorganisationer borde skaffa sig en nulägesbild kring evidensläget om Bröset, ABRAT-EMS m.fl. skalor innan avgörande beslut fattas. Oavsett vilket verktyg vi väljer så behövs mer forskning, men jag får medge att jag blir lite oroad att ”vi” förhastat oss lite…

    Kim, S. C.; Dunn, K.; Youells, C.; Whitmore, G.; McComack, A.; Dievendorf, E.; Bell, C.; Burnett, S. J.; Kim, S.; Clemency, B. Aggressive Behavior Risk Assessment Tool for Emergency Medical Services. JACEP Open 2025;6(3):100095. doi:10.1016/j.acepjo.2025.100095
  • A Methodology for Assessing Blast Protection in Explosive Ordnance Disposal Bomb Suits

    Dagens studie är en outsider, får man nog säga. Det är också utan överdrift den mest svårtolkade/svårkonsumerade studien jag läst hittills. Anledningen till att jag läst den är en fråga jag fick (från räddningstjänsten) på jobbet i veckan kring vilka skador man kan förvänta sig hos någon som haft på sig en bombskyddsdräkt och varit utsatt för en detonation, och underförstått då också vilket skydd dräkten kunde förväntas ge. Jag kunde såklart ge ett litet utlägg om de olika skademekanismer man brukar tala om i samband med explosion, men vad visste jag om bombskyddsdräkter…? ABSOLUT INGENTING.

    Så, dagens studie var i princip den enda jag hittade när jag försökte ta reda på mer om detta. I studien har författarna använt ”crash test dummies” monterade på en ställning och utsatt dessa upprepade gånger för explosioner av två olika magnituder, med respektive utan bombskyddsdräkt. Fyra olika fabrikat på dräkter användes, och reaktionerna på dockan mättes med bl.a. accelerometrar. En viktig sak är att författarna enbart undersökt tryckvågsskador, och skador av exempelvis splitter eller värme är alltså inte taget i beaktande alls. Jag får medge att jag inte hade helt lätt att tolka resultatet, men jag tog iallafall med mig:

    • Dräkten ger ett skydd i form av att tryckvågen inne i dräkten dämpas, med lägre risk för mekaniska skador.
    • Tryckvågen vid bröstkorgen dämpades och spriddes över längre tid, vilket reducerade risken för allvarliga bröstkorgsskador.
    • Dräkten verkade skydda väl mot tryckvågsskada på lungorna, och inga värden på nivå som skulle ge ruptur på lungan uppmättes med de aktuella (relativt små) laddningsstorlekarna.
    • Dräkterna gav visst skydd för huvudet, men detta var det ”svagaste kortet”. Olika dräkter presterade olika bra och ett större visir var förknippat med sämre skydd då det blev som ett segel i tryckvågen. En hjälm med hög massa var också bättre än en med låg. Så dräkten ska med fördel ha stor, tung hjälm och minimalt visir – vilket förmodligen inte lirar särskilt bra med användbarheten för det arbete som ska utföras i dräkten.
    • Krafterna som verkade på nacken var relativt låga och under gränsvärdet för vad som torde ge allvarliga skador, givet de laddningar som användes.

    Hur mycket allt detta ger i praktiken är väl ganska tveksamt. Dels är det extremt beroende av laddning, kroppsställning och typ av dräkt – sen är studien också 20 år gammal och massor kan ha hänt exempelvis på dräktmarknaden. Och som sagt, studien berör inte övriga skademekanismer vid explosion, utan bara den primära tryckvågen. De enda egentliga slutsatser jag drar är nog att man är bättre skyddad med dräkt än utan, och att huvudet är den kanske svagaste punkten i själva dräktens skydd. Den kliniska tillämpbarheten i detta är dock begränsad, givet att så många andra skademekanismer finns och att ingen slags skademisstanke på något vis kan avskrivas tack vare dräkten.

    Jag vet ju att många kollegor har militära erfarenheter – kanske har du mer info på temat? Använd gärna kontaktformuläret och dela. Sällanhändelse får man väl verkligen kalla det, men ändå intressant om man ställs inför scenariot!

    “Dale” Bass, C.; Davis, M.; Rafaels, K.; “Steve” Rountree, M.; Harris, R. M.; Sanderson, E.; Andrefsky, W.; DiMarco, G.; Zielinski, M. A Methodology for Assessing Blast Protection in Explosive Ordnance Disposal Bomb Suits. International Journal of Occupational Safety and Ergonomics 2005;11(4):347-361. doi:10.1080/10803548.2005.11076655