### Title of Data Archiving Project: Historical records of wildlife, invertebrates and plants in Alberta
Français ci-dessous
**Collaborating Researcher(s) and Agency:** Craig Harding and Beth McLarnon of Nature Conservancy Canada
**Description of Project:** Over the last 15 years, the Nature Conservancy of Canada has compiled species
records in Alberta as part of their baseline assessments as well as monitoring events (e.g. bio-blitzes, bird
counts). Most of this data is not public, but if it were transferred to publicly accessible provincial repositories it
could support a broader provincial data program used by many organizations to guide conservation planning,
species modelling, and mapping. The data to be rescued include records of provincially significant species,
Species at Risk, common species, and nesting and denning sites, all currently in an NCC database. The intern
would begin by verifying the subset of records to be transferred from the NCC database to provincial
repositories via intermediary data files. An important step is quality assessment of the records, including the
conversion of common names to species codes and identification of missing data that will hinder the upload. As
there are >10,000 records, such tasks must be automated through computer scripts or macros developed by the
intern. The data would then be organized in the right format to upload to two provincial repositories - ACIMS
(plants, invertebrates) and FWMIS (wildlife). Finally, the intern would provide documentation, resources and
training to NCC to ensure future records can be easily shared with ACIMS and FWMIS.
**Renumeration:** As with all Living Data Project internships, a fellowship of $6500 is provided for 6 weeks of
full-time internship (or the equivalent spread over a longer time period). This fellowship is intended to
contribute to the annual stipend of the graduate student, and is inclusive of any benefits or costs.
**Internship date.** Start: Anytime between Oct. 1 and Dec. 1 2020. End: latest by March 1 2021.
**Internship location:** Virtual, with frequent check-ins with NCC staff.
**Other potential benefits to intern:** This data rescue internship partially fulfils the requirements of the CIEE
Certificate in Data Management and Reproducible Research (see https://www.ciee-icee.ca/data.html). NCC will
provide project specific support, including meetings that discuss the mission of NCC and provide a more indepth
look at the non-profit environmental sector in Canada. If there is a certain avenue of NCC work that a
intern is interested in learning more about, NCC will facilitate connecting the intern with relevant staff and
partners. Non-profits like NCC often offer an opportunity for interns to be hired longer term, whether it is with
their organization, or by partners that are looking for skillsets that the students demonstrate during internships.
By developing a process that supports both historical and future data migration to public repositories, the intern
will have expertise of value to many land trusts or similar organizations.
**Qualifications:** The candidate must be registered as a graduate student at one of the following four universities:
University of British Columbia, McGill University, University of Regina and Université de Montréal. The
candidate’s major area of research must be one of ecology, evolution or environmental science. The ideal
candidate will have research interests in wildlife or plant ecology, or conservation biology. The candidate must
be able to write computer scripts that efficiently validate and reorganize dataframes, and to program functions
that convert common names to species codes. The candidate will ideally be registered in the Living Data
Project’s fall 2020 modules on Productivity and Reproducibility in Ecology and Evolution
(https://osf.io/uwzx5/wiki/Course%20outline/) and Scientific Data Management for Ecology and Evolution
(https://osf.io/sjf2g/wiki/Course%20outline/), although we are willing to consider equivalent training or
demonstration of skills. The candidate should be competent in scientific computing, enthusiastic about
preserving legacy data and demonstrate a commitment to open science.
**Application:** Please fill in the application form located here [https://ubc.ca1.qualtrics.com/jfe/form/SV_6g0M5aXcrUCmJwh] by September 15th 2020.
### Titre du projet d'archivage des données : Données historiques sur la faune, les invertébrés et les plantes en Alberta
**Chercheur et chercheuse collaborant et organisation :** Craig Harding et Beth McLarnon de Conservation de
la nature Canada
**Description du projet :** Au cours des 15 dernières années, Conservation de la nature Canada (CNC) a compilé
des données sur les espèces présentes en Alberta dans le cadre de ses évaluations de référence ainsi que de
divers inventaires biologiques (tels que les BioBlitz, et les décomptes d’oiseaux). En ce moment, la plupart de
ces données ne sont pas accessibles. Si elles étaient transférées dans les dépôts provinciaux ouverts, elles
pourraient grandement les bonifier, et de nombreuses organisations pourraient mobiliser ces données dans la
planification de la conservation, la modélisation des espèces et la cartographie de leur distribution. Les données
à sauvegarder comprennent des inventaires d'espèces d'importance provinciale, d'espèces en péril, d'espèces
communes et de sites de nidification et de mise bas, toutes actuellement dans une base de données de CNC. Le
ou la stagiaire commencera par vérifier le sous-ensemble d'enregistrements à transférer de la base de données de
CNC aux dépôts provinciaux au moyen de fichiers de données intermédiaires. Cette étape importante permet
l'évaluation de la qualité des enregistrements, et permet des ajustements tels que la conversion des noms
communs en codes d'espèces et l'identification des données manquantes qui entravent le téléchargement.
Puisqu’il y a plus de 10 000 enregistrements, ces tâches devront être automatisées à l’aide de scripts
informatiques ou de macros développés par le ou la stagiaire. Les données devront ensuite être converties dans
le bon format pour être téléchargées dans deux dépôts provinciaux – ACIMS (plantes, invertébrés) et FWMIS
(faune). Enfin, le ou la stagiaire fournira de la documentation, des ressources et de la formation à CNC pour
s'assurer que les futures données pourront être facilement déposées dans ACIMS et FWMIS.
**Rémunération :** Comme pour tous les stages du projet Living Data, une bourse de 6500 $ est fournie pour
6 semaines de stage à temps plein (ou l'équivalent réparti sur une période plus longue). Cette bourse vise à
contribuer aux revenus de l'étudiant ou l’étudiante des cycles supérieurs et inclut tous les avantages ou couts.
**Date du stage –** Début : à tout moment entre le 1er octobre et le 1er décembre 2020. Fin : au plus tard le 1er mars 2021.
**Lieu de stage :** Virtuel, avec des prises de contact régulières avec le personnel de CNC.
**Autres avantages potentiels du stage :** Ce stage de sauvetage de données répond en partie aux exigences du
certificat de l’ICEE en gestion des données et recherche reproductible (voir https://www.francais.cieeicee.
ca/donneacutees.html). CNC soutiendra le projet de diverses manières : des réunions permettront de
discuter de la mission de l’organisme et offriront un regard approfondi sur le secteur environnemental sans but
lucratif au Canada; et CNC mettra en lien la ou le stagiaire avec les responsables de secteurs l’intéressant
davantage. Les organismes sans but lucratif comme CNC offrent souvent la possibilité aux stagiaires d'être
embauché-e-s à plus long terme, que ce soit au sein de leur organisation ou chez des partenaires à la recherche
de compétences démontrées pendant les stages. En développant un processus qui prend en charge la migration
des données historiques et futures vers des référentiels publics, le ou la stagiaire aura une expertise attrayante
pour de nombreuses fiducies foncières ou organisations similaires.
**Qualifications requises :** Les personnes candidates doivent être inscrites aux cycles supérieurs dans l'une des
quatre universités suivantes : University of British Columbia, Université McGill, University of Regina ou
Université de Montréal. Le principal domaine de recherche des personnes candidates doit être l’écologie,
l’évolution ou les sciences de l’environnement. La personne idéale aura des intérêts de recherche en écologie de
la faune ou des plantes, ou en biologie de la conservation. Les personnes candidates doivent être capables
d'écrire des scripts informatiques qui valident et réorganisent efficacement les trames de données, et de
programmer des fonctions pour convertir les noms communs en codes d'espèces. Les personnes candidates
seront idéalement inscrites aux modules de cours du projet Living Data en automne 2020 : Productivité et
reproductibilité en écologie et évolution (https://osf.io/uwzx5/wiki/Course%20outline/) et Gestion des données scientifiques en écologie et évolution (https://osf.io/sjf2g/wiki/Course%20outline/), bien que nous soyons disposés à envisager une formation ou une démonstration de compétences équivalentes. Les personnes
candidates doivent également être compétentes en informatique scientifique, enthousiastes à l'idée de préserver
les données historiques et démontrer leur engagement envers la science ouverte.
**Dépôt de candidature :** Veuillez remplir le formulaire de candidature accessible ici [https://ubc.ca1.qualtrics.com/jfe/form/SV_6g0M5aXcrUCmJwh] d’ici le 15 septembre 2020.