*Français ci-dessous*
# Data Curation for PFAS in Quebec Surface Waters
**Collaborating Researcher(s) and Agency:**
- Université de Montréal, Sébastien Sauvé;
DataStream Initiative
**Description of Project:**
Surface water samples were collected across freshwater bodies, in Quebec, Canada for PFAS detection and quantification. The primary purpose of collecting this dataset was to evaluate the levels of extended target PFAS in surface water across Quebec province. Regular monitoring of these harmful chemicals is required to assess their presence and potential impact on the environment and public health. This dataset will allow us to understand the changes in PFAS levels over time in surface water by comparing past data with present findings.
The data rescue internship will consist of:
- Develop code script to clean and format data into the DataStream schema
- Identify any potential quality control issues in the data (e.g., populating missing metadata, identifying incorrect location data)
- Ensure the inclusion of complete metadata
- Upload the dataset(s) to DataStream's open data platform
The data consists of Excel spreadsheets.
**Renumeration:**
As with all Living Data Project internships, a fellowship of $6500 is provided for 6 weeks of full-time internship (or the equivalent part-time work spread over a longer time period; **240 hours total**). This fellowship is intended to contribute to the annual stipend of the graduate student and is inclusive of any benefits or costs.
**Internship date:**
`Start: anytime between November 1, 2024 – December 1, 2024, or January 2, 2025`
`End: latest by February 28, 2025`
**Internship location:**
Remote
**Other potential benefits to intern:**
This data rescue internship partially fulfills the requirements of the CIEE Certificate in Data Management and Reproducible Research (see https://www.ciee-icee.ca/ldp-certificates.html). The intern will have the valuable experience of working with a non-profit organization and contributing to an open dataset that can be used in valuable future research and decision-making processes. The datasets are community science based, so there is also the potential for outreach should the intern be interested. Additionally, the intern will have the opportunity to engage with the research team at Université de Montréal to gain insight into how the data has been and will be utilized by the research community and others.
**Qualifications required:**
Students must be currently registered in a graduate program in ecology, environmental science, evolution or a related discipline in a Canadian university. Students should either be enrolled in a [CIEE](https://www.ciee-icee.ca/membership.html) member university, or they or their supervisor must be a current CSEE member. The candidate’s major area of research must be one of ecology, evolution, or environmental sciences, and the candidate must demonstrate that they have the conceptual training necessary to evaluate the ecological value of the data that they may encounter in this project. The candidate must be able to create computer scripts (R or Python) to manage digital data, including data validation, compilation, and quality control, and have the relevant scientific expertise to create useful metadata. The candidate should be enthusiastic about preserving legacy data and demonstrate a commitment to open science.
**Qualifications desired:**
The ideal candidate will have research interests in environmental chemistry, limnology, or related disciplines. The candidate will ideally have completed or plan to register in the Living Data Project's modules on Productivity and Reproducibility [course outline](https://osf.io/ghwua/wiki/Course%20descriptions/) and Scientific Data Management [course outline](https://osf.io/ghwua/wiki/Course%20descriptions/). We will also consider equivalent training or demonstration of skills. **Other desired qualifications include experience with statistics.**
Please fill in the [application form](https://ubc.ca1.qualtrics.com/jfe/form/SV_6Pekcmv8VqrZ02y) by `18 June 2024`.
# Conservation des données sur les PFAS dans les eaux de surface du Québec
**Chercheuse collaborant et organisation :**
- Université de Montréal — Sébastien Sauvé ;
DataStream Initiative
**Description du projet :**
Des échantillons d’eau de surface ont été collectés dans des plans d’eau douce au Québec (Canada), afin de détecter et de quantifier les PFAS. L’objectif principal de la collecte de ces données était d’évaluer la concentration d’un ensemble étendu de PFAS dans les eaux de surface de la province de Québec. Une surveillance régulière de ces produits chimiques nocifs est nécessaire pour évaluer leur présence et leur impact potentiel sur l’environnement et la santé publique. Cet ensemble de données nous permettra de comprendre les changements dans les niveaux de PFAS au fil du temps dans les eaux de surface en comparant les données passées avec les résultats actuels.
Le stage de sauvetage de données consistera à :
- Encoder un script pour nettoyer et formater les données en DataStream ;
- Identifier tout problème potentiel de contrôle de qualité dans les données (métadonnées manquantes, erreurs dans les données de localisation, etc.) ;
- Assurer l’inclusion de métadonnées complètes ;
- Déposer le ou les ensembles de données sur la plateforme de données ouvertes DataStream.
Les données se retrouvent actuellement dans des feuilles de calcul Excel.
**Rémunération :**
Comme pour tous les stages du Projet Living Data, une bourse de 6500 $ est fournie pour 6 semaines de stage à temps plein (ou l’équivalent réparti sur une période plus longue, soit **240 heures au total**). Cette bourse vise à contribuer aux revenus de l’étudiant ou de l’étudiante aux cycles supérieurs et inclut tous les avantages ou couts.
**Date du stage :**
`Début : n’importe quand, entre le 1er novembre et le 1er décembre 2024 ou à partir du 2 janvier 2025`
`Fin : au plus tard le 28 février 2025`
**Lieu du stage :**
À distance
**Autres avantages potentiels du stage :**
Ce stage de sauvetage de données répond en partie aux exigences du certificat de l’ICEE en gestion des données et recherche reproductible (voir https://www.ciee-icee.ca/ldp-certificates-444444.html). Le ou la stagiaire bénéficiera d’une précieuse expérience de travail avec une organisation à but non lucratif et contribuera à un ensemble de données ouvertes qui pourra être utilisé dans la recherche et la prise de décision dans le futur. Les ensembles de données s’appuient sur la science communautaire, donc, si la personne stagiaire est intéressée, iel pourra participer à des activités de sensibilisation. De plus, le ou la stagiaire aura l’occasion de dialoguer avec l’équipe de recherche de l’Université de Montréal pour mieux comprendre comment les données ont été et seront utilisées par la communauté de recherche et d’autres personnes concernées.
**Compétences requises :**
Les candidates et candidats doivent être actuellement aux études aux cycles supérieurs en écologie, sciences de l’environnement, évolution ou autre discipline connexe dans une université canadienne. Cette université doit être membre de [l’ICEE](https://www.ciee-icee.ca/membership.html), ou encore, l’élève, son ou sa superviseure doit être membre de la SCEE. Le principal domaine de recherche des personnes candidates doit être en écologie, en évolution ou en sciences de l’environnement. Les candidats et candidates doivent démontrer qu’iels possèdent la formation conceptuelle nécessaire pour évaluer la valeur écologique des données du projet. Iels doivent être capables de créer des scripts informatiques (R ou Python) pour gérer des données numériques, les valider, les compiler et contrôler leur qualité, ainsi que pour créer les métadonnées appropriées. Enfin, les personnes candidates doivent être enthousiastes à l’idée de préserver des données historiques et démontrer leur engagement envers la science ouverte.
**Compétences recherchées :**
Le ou la candidate idéale a des intérêts de recherche en chimie de l’environnement, limnologie ou dans une discipline connexe. Le ou la candidate aura idéalement effectué les modules du Projet Living Data sur la productivité et la reproductibilité [plan de cours — en anglais](https://osf.io/ghwua/wiki/Course%20descriptions/) et la gestion des données scientifiques [plan de cours — en anglais](https://osf.io/ghwua/wiki/Course%20descriptions/) ou aura entamé les procédures d’inscription à ces modules. Une formation équivalente ou une démonstration de compétences seront aussi considérées. Une expérience en statistiques est un atout.
Veuillez remplir le [formulaire de candidature](https://ubc.ca1.qualtrics.com/jfe/form/SV_6Pekcmv8VqrZ02y) d’ici le `18 Juin 2024.`