Перейти к содержимому

Судебно-медицинский форум forens.ru

Forensic medical forum

Судебно-медицинский форум

Статистический анализ в судебно-медицинской антропологии


Сообщений в теме: 9

#1 Nedugov Отправлено 27 Март 2017 - 14:20

  • K
  • 31 сообщений
Монография "Статистический анализ в судебно-медицинской антропологии" была первой книгой, написанной в период нашего повального увлечения математикой. То были такие далекие времена, что никакого интернета у нас вообще не было. Поэтому эта книга в инете никогда не распространялась. Хотя прошло уже 10 лет, не поздно еще все исправить.

Библиографическое описание: Статистический анализ в судебно-медицинской антропологии [Текст] / Г.В. Недугов, В.В. Недугова. - Самара: [Кредо], 2007. – 263, [1] с. : ил. – 200 экз. – ISBN 5-86611-043-1.

Монография посвящена проблемам оптимизации статистического анализа биометрических данных при судебно-медицинской антропологической идентификации. В работе рассмотрены методы корреляционного, регрессионного, дискриминантного и кластерного видов анализа. Кроме традиционно используемых статистических процедур освещены перспективные, но пока еще не нашедшие должного применения методы одномерной биномиальной классификации при различных распределениях биометрических показателей. Особое внимание уделяется приемам статистического анализа при несоответствии эмпирических данных предпосылкам математических моделей статистических методов. Впервые в судебно-медицинской литературе предлагаются критерии и методы объективного сравнения точности регрессионных диагностических моделей и моделей классификации объектов экспертного познания.

Монография предназначена для исследователей, занимающихся проблемами судебно-медицинской антропологической идентификации, и судебно-медицинских экспертов медико-криминалистической специализации, преподавателей медицинских вузов, а также может быть полезной для любых исследователей, применяющих методы многомерного статистического анализа в биомедицине.

В свое время по материалам этой и иных наших книг "математического периода" проф. В.Н. Звягиным нам было предложено выступить на какой-то серьезной конференции в Москве с докладом. Доклад был подготовлен, а потом чего-то я струхнул (к тому времени надоело слушать, что математика ни к чему) и под каким-то предлогом не поехал. Так он и пылился все это время, ни разу нигде не доложенный. И это тоже можно исправить. Доклад в краткой форме повторяет содержание рассматриваемой монографии:

Прикрепленные файлы


Сообщение отредактировал myt: 27 Март 2017 - 15:00
Добавил в библиотеку


реклама

#2 SLeonov Отправлено 27 Март 2017 - 20:49

  • team
  • 3 955 сообщений
Спасибо!

#3 dpb13dpb44 Отправлено 05 Апрель 2017 - 15:46

  • участник
  • 17 сообщений
да уж точно, "математика ум в порядок приводит"

#4 Edward Отправлено 10 Апрель 2017 - 09:13

  • K
  • 2 851 сообщений
Откопал самарскую статью про статистические ошибки в журнале СМЭ. По понятным причинам, опубликовать ее они могли только в собственном сборнике научных работ. Кому интересно, прилагаю саму статью и весь сборник целиком.

Прикрепленные файлы



#5 Edwin Отправлено 10 Апрель 2017 - 13:30

  • tеаm
  • 6 331 сообщений
Спасибо за статьи. Возникает у меня, однако, серия практических вопросов.
Книжки нужно читать..... ну никто не спорит с этой аксиомой, но я немного про другое. Мы же на форуме тусуемся. Эта форма проф. общенния требует иных подходов к изложению информации. Надо короче, конкретнее и простым языком писать.

Отсюда осмелюсь задать конкретный первый вопрос, пусть не самим уважаемым авторам выложенных книг и статей, но у нас есть и свои статистики и потому, наприм. Эдвард, должен тоже с вопросами справиться.

Давайте пройдём статистически весь этап научного исследования и разберёмся что и как сегодня ожидается от научной работы с точки зрения доказательности результатов. Поэтому не хватаюсь за всё, а задаю простой 1-й вопрос:

1. Сколько мне надо набрать наблюдений?
Гипотетически я хочу решить проблему установления возраста индивидуума по длине окружности брюшной аорты. Эту тему мы разбирали пару раз на форуме и есть публикации. Но не суть. Я, как молодой исследователь, получил задачу от шефа мерить аорты у всех подряд и написать статью к концу года. Блин, ну не знаю с чего начать, в смысле сколько групп и из каких возрастных интервалов мне надо набрать. Рабочая гипотеза проста. С возрастом закономерно увеличивается длина окружности аорты.

Господа судебные статистики. Можете вы нам "на пальцах" объяснить как высчитать минимально необходимое число наблюдений и оптимальное число наблюдений?

#6 Edward Отправлено 10 Апрель 2017 - 13:52

  • K
  • 2 851 сообщений
Т.е. предполагается диагностическую модель строить с помощью регрессионного анализа. Тогда нужно для начала штук 40 наблюдений собрать, вычислить корреляцию, построить доверительный интервал, посмотреть на наличие, силу и характер зависимости. По этим данным уже можно будет принимать решение: 1) зависимости нет и можно все бросить; 2) зависимость есть, но слабая и для практики бесполезная, можно все бросить; 3) пахнет приличной зависимостью, дело нужно продолжить. В целом для регрессионного анализа требуемое количество наблюдений зависит лишь от приемлемости доверительного интервала для прогнозный значений. А в формулу его определения входят остаточная дисперсия и критерий Стьюдента. На остаточную дисперсию вы повлиять не можете. Зато вы можете повлиять на критерий Стьюдента. А его величина тем меньше, чем больше объем выборки. Приемлемые для практики значения Стьюдента (меньше 2,0) начинаются с объема выборки, равной 100. Отсюда для построения регрессионной модели все равно понадобится не менее 100 наблюдений. С другой стороны, более 100 наблюдений тоже нет смысла набирать, ибо двусторонний критерий при 100 равен 1,984, при 150 - 1,976, при 200 - 1,972. Т.е. с ростом объема выборки значительного уменьшения величины критерия (на который нужно умножить остаточную дисперсию) и, соответственно, доверительной области не происходит. Отсюда самое то - примерно 120-130 наблюдений, но если измерять не самому, а поручить кому-нить другому, то можно и все 500 набрать :).

#7 Edwin Отправлено 10 Апрель 2017 - 14:08

  • tеаm
  • 6 331 сообщений
Итак, мне нужно набрать 120-130 случаев.

Прекрасно! Но что делать с распределением по возрастным группам? Я собираюсь работать со взрослыми, т.е. от 20 лет до 80. Получается 6 возрастных групп по 10 лет в каждой. Правильно ли я понимаю, что мне надо для равномерности обязательно по 20 наблюдений в каждой возрастной группе набрать? А можно в первой группе 20-29 лет например только 3 случая, но зато в группе 60-69 у меня будет 37 случаев?

И что делать с полом? Мне надо по 120 наблюдений для женщин и мужчин, т.е. 240 случаев всего или можно всего 120 случаев набрать?

#8 Edward Отправлено 10 Апрель 2017 - 15:20

  • K
  • 2 851 сообщений
Желательно, чтобы наблюдения в возрастных группах были распределены равномерно. Ну не прямо в каждой точно по 20, пойдет и 10-30. Но 37 и 3 лучше не надо. Три можно в крайней группе - свыше 80-ти. Однако, математическая модель регрессионного анализа не предписывает обязательного соблюдения равномерности, поэтому на практике делают, как получится. Если в какой-то группе слишком долго и сложно наблюдения набирать, то ограничиваются тем количеством, что есть.

Если показатель сильно зависит от пола, то нужно отдельные регрессии строить для каждого пола по соответствующим выборкам (каждая по 120). Это называется неоднородность корреляции. Или вводить показатель пола в общее уравнение регрессии, что мне лично не нравится (т.н. индикаторные переменные). И тут еще с практической точки зрения встают "неудобные" вопросы. Например, если модель предназначена только для конкретного пола, то сначала нужно узнать как-то пол по той же аорте при неизвестном возрасте. Также для применения модели нужно заранее знать, что аорта принадлежит челу в возрасте 20-80 лет (для других возрастов она не предназначена), а возраст-то нам как раз и нужно определить. Т.е. построить можно все, что угодно, но на практике выйдет одно пузоведение :). Похожая идея бродила в голове у моего шефа в 1997-м году. Но по вышеназванным причинам я за нее не взялся. В таких случаях, когда приспичило что-нить поизмерять, умные люди берут либо орган, принадлежащий только одному полу, например, половые железы (как это сделали в Саратове), либо берут показатель, не зависящий от пола. К тому же ищут показатель, который изменяется монотонно (без пиков) на всей продолжительности жизни, либо находят способ, как определить показания к использованию модели. Например, сначала по атеросклерозу аорты определить, что это не моложе 20-ти лет, а потом по окружности с помощью модели уже прогнозировать возраст. А лучше, чтобы возрастных ограничений для применения модели вообще не было.

#9 Edwin Отправлено 11 Апрель 2017 - 11:18

  • tеаm
  • 6 331 сообщений
Спасибо!
Для итоговой формулы предлагается использовать дискриминантный анализ для отнесения исследуемого индивидуума к определённой возрастной группе.

А есть ли другие методы чтобы наприм. задавая длину окружности аорты мы получали конкретный возраст, типа 65,4 года? Ну и конечно ошибку т.е. плюс/минус. Или уравнение дискриминантного анализа это автоматом даёт?

#10 Edward Отправлено 11 Апрель 2017 - 11:41

  • K
  • 2 851 сообщений
Дискриминантный анализ этого как раз и не дает. Его цель - по количественным признакам прогнозировать принадлежность объекта к одной из двух или более качественных групп (например, мужчина или женщина). Если же вам нужно по количественным признакам прогнозировать количественный же признак, каковым является возраст, то вам нужен регрессионный анализ. Именно он и дает точечную (усредненную) оценку плюс-минус доверительный интервал для значений заданной степени доверительной вероятности.



Сообщество русскоговорящих судебно-медицинских экспертов
Community of Russian-speaking forensic medical experts
© 2006-2017 Forens.ru