<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
  </head>
  <body text="#000000" bgcolor="#FFFFFF">
    <div class="moz-cite-prefix">Hi Philippe,<br>
      <br>
      I completely agree with your view. This is why data stewardship is
      needed before we can make real use of the data:
      <a class="moz-txt-link-freetext" href="https://en.wikipedia.org/wiki/Data_steward">https://en.wikipedia.org/wiki/Data_steward</a><br>
      <br>
      As we use this approach in HiGHmed, I might be able to report in
      2020 about lessons learned :) <br>
      <br>
      Best,<br>
      <br>
      -- <br>
      <b>Birger Haarbrandt, M. Sc. <br>
        Peter L. Reichertz Institut for Medical Informatics (PLRI) <br>
        Technical University Braunschweig and Hannover Medical School <br>
        Software Architect HiGHmed Project </b><br>
      Tel: +49 176 640 94 640, Fax: +49 531/391-9502 <br>
      <a class="moz-txt-link-abbreviated" href="mailto:birger.haarbrandt@plri.de">birger.haarbrandt@plri.de</a> <br>
      <a class="moz-txt-link-abbreviated" href="http://www.plri.de">www.plri.de</a><br>
      <br>
      <br>
      <br>
      Am 03.07.2018 um 12:21 schrieb Philippe Ameline:<br>
    </div>
    <blockquote type="cite"
      cite="mid:d4adf6d4-1adb-12e3-1f3c-ffcb9e76630b@free.fr">
      <pre wrap="">Le 02/07/2018 à 11:31, Bert Verhees a écrit :

</pre>
      <blockquote type="cite">
        <pre wrap="">On 30-06-18 17:16, Philippe Ameline wrote:
</pre>
        <blockquote type="cite">
          <pre wrap="">(improperly labeling images or adding images of objects that are not
plants) could probably make the whole app plainly crappy.
</pre>
        </blockquote>
        <pre wrap="">
Of course Philippe, but that would be vandalism. Most sensible people
don't do that when they stand behind the goal, and a little bit of
dirt, therefor it is Machine Learning, it can filter it out. It is
part of the learning process.
</pre>
      </blockquote>
      <pre wrap="">
If a culture of data quality is properly installed, then it is possible
to name improper use "vandalism".
In medicine, since such a culture has never existed, we could name it
"don't carisme", "no time for thisisme" or "was never thaughtisme".

My point, and what the paper I previously pointed out explains, is that
trying to get something out of machine learning in a domain of poor data
quality is a modern kind of magic thinking.
It just means that any such project should first organize for data
quality as a first step.

When considering it in hindsight, it makes sense since machine learning
involves statistics and data quality is paramount in this domain.


_______________________________________________
openEHR-clinical mailing list
<a class="moz-txt-link-abbreviated" href="mailto:openEHR-clinical@lists.openehr.org">openEHR-clinical@lists.openehr.org</a>
<a class="moz-txt-link-freetext" href="http://lists.openehr.org/mailman/listinfo/openehr-clinical_lists.openehr.org">http://lists.openehr.org/mailman/listinfo/openehr-clinical_lists.openehr.org</a>
</pre>
    </blockquote>
    <p><br>
    </p>
    <div class="moz-signature"><br>
    </div>
  </body>
</html>